一篇题为“Depth Registers Unlock W4A4 on SwiGLU: A Reader/Generator Decomposition”的研究论文已被从arXiv撤回。该论文探讨了在3亿参数语言模型上进行训练后W4A4量化,旨在降低困惑度误差。它引入了一种名为深度寄存器(Depth Registers)并带有铰链损失(hinge loss)的方法,显著改善了量化结果,但与FP16相比仍有小差距。 AI
排序理由 该集群包含一篇被撤回的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →