English(EN) Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

新的Spec-AUF训练方法提高了掩码块草稿器的性能

作者 PulseAugur 编辑部 · [2 个来源] · 2026-07-02 08:44

研究人员开发了一种名为Spec-AUF的新训练方法，用于掩码块草稿器，这是投机解码中用于更快自回归文本生成的一个组件。该方法通过将监督集中在接受的前缀上，而不是通常在第一次拒绝后被丢弃的整个块上，来提高草稿器预测令牌块的能力。在Qwen3_8B模型上的实验表明，Spec-AUF增加了令牌的平均发出长度，从而在多个基准测试中提高了性能。 AI

影响提高了自回归生成的效率，可能导致AI模型响应速度更快。

排序理由该条目是一篇详细介绍AI模型新训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Tianjian Yang, Meng Li · 2026-07-03 04:00

Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

arXiv:2607.01893v1 Announce Type: new Abstract: Speculative decoding accelerates autoregressive generation by drafting a block of tokens that the target model verifies left-to-right, committing only the longest accepted prefix. Block (DLM-style) drafters predict the whole block i…
arXiv cs.CL TIER_1 English(EN) · Meng Li · 2026-07-02 08:44

Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

Speculative decoding accelerates autoregressive generation by drafting a block of tokens that the target model verifies left-to-right, committing only the longest accepted prefix. Block (DLM-style) drafters predict the whole block in parallel, which is fast but trained with a ful…

报道来源 [2]

Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

相关实体

相关话题