PulseAugur
实时 09:46:14
English(EN) RobuQ: Pushing DiTs to W1.58A2 via Robust Activation Quantization

RobuQ 框架使扩散 Transformer 能够在超低比特精度下运行

研究人员开发了 RobuQ,一个旨在显著降低图像生成扩散 Transformer (DiTs) 计算和内存成本的新框架。该方法侧重于鲁棒激活量化,使 DiTs 能够在极低的比特设置下运行,特别是在 ImageNet-1K 上实现稳定的图像生成,激活量化平均为 2 比特。该框架引入了如 RobustQuantizer 和仅激活混合精度网络管道等新技术,以克服量化 DiT 激活的挑战。 AI

影响 能够更有效地部署用于图像生成的扩散 Transformer,可能降低硬件要求。

排序理由 该集群包含一篇详细介绍优化 AI 模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Kaicheng Yang, Xun Zhang, Haotong Qin, Yucheng Lin, Kaisen Yang, Xianglong Yan, Yulun Zhang ·

    RobuQ:通过鲁棒激活量化将 DiTs 推至 W1.58A2

    arXiv:2509.23582v2 Announce Type: replace Abstract: Diffusion Transformers (DiTs) have recently emerged as a powerful backbone for image generation, demonstrating superior scalability and performance over U-Net architectures. However, their practical deployment is hindered by sub…