研究人员开发了 RobuQ,一个旨在显著降低图像生成扩散 Transformer (DiTs) 计算和内存成本的新框架。该方法侧重于鲁棒激活量化,使 DiTs 能够在极低的比特设置下运行,特别是在 ImageNet-1K 上实现稳定的图像生成,激活量化平均为 2 比特。该框架引入了如 RobustQuantizer 和仅激活混合精度网络管道等新技术,以克服量化 DiT 激活的挑战。 AI
影响 能够更有效地部署用于图像生成的扩散 Transformer,可能降低硬件要求。
排序理由 该集群包含一篇详细介绍优化 AI 模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →