一款名为 PixelDiT 的新型扩散 Transformer 模型已发布,拥有 13 亿参数,直接在像素空间运行,无需 VAE。该模型设计高效,仅需 4GB VRAM,并与 Hugging Face Diffusers 库完全兼容。它还集成了对 Qwen 编码器的支持,增强了其功能。 AI
影响 为图像生成任务提供了一个新的、高效的扩散模型。
排序理由 发布了一个具有技术规格的新开源模型。[lever_c_降级自研究:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →