一篇新的研究论文探讨了模型架构、规模和特定的量化感知训练 (QAT) 配方如何在 FP4 精度下影响异常分割模型的质量。研究发现,与 CNN 相比,基于注意力机制的架构(如 Swin Transformer)对不同的 QAT 配方选择具有显著的韧性,尤其是在更大的规模下。研究结果表明,由于其鲁棒性,Swin Transformer 是 FP4 量化异常分割任务的推荐选择。 AI
影响 强调了架构选择对量化鲁棒性的重要性,可能指导未来用于高效推理的模型开发。
排序理由 这是一篇研究论文,详细介绍了异常分割的模型架构和量化技术的研究结果。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →