研究人员开发了一种名为Spec-AUF的新训练方法,用于掩码块草稿器,这是投机解码中用于更快自回归文本生成的一个组件。该方法通过将监督集中在接受的前缀上,而不是通常在第一次拒绝后被丢弃的整个块上,来提高草稿器预测令牌块的能力。在Qwen3_8B模型上的实验表明,Spec-AUF增加了令牌的平均发出长度,从而在多个基准测试中提高了性能。 AI
影响 提高了自回归生成的效率,可能导致AI模型响应速度更快。
排序理由 该条目是一篇详细介绍AI模型新训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- FLASH
- Gotit.pub
- HCL Domino
- Hugging Face
- Masked Block Drafters
- Qwen3_8B
- ScienceCast
- Spec-AUF
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →