研究人员为 Ideogram 4.0 文本到图像扩散 Transformer 开发了新的训练后量化技术。他们的 INT8 W8A8 方法在缺乏 FP8 张量核心的消费级 GPU 上保持了 FP8 质量,性能优于 NF4 量化。此外,他们的 GGUF Q4_K 量化提供了比 NF4 更好的质量-内存权衡。 AI
影响 使先进的文本到图像模型能够在低端硬件上运行,可能拓宽访问范围和用例。
排序理由 该集群包含一篇详细介绍模型量化技术新研究的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →