PulseAugur
实时 11:48:22
English(EN) Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

新的Spec-AUF训练方法提高了掩码块草稿器的性能

研究人员开发了一种名为Spec-AUF的新训练方法,用于掩码块草稿器,这是投机解码中用于更快自回归文本生成的一个组件。该方法通过将监督集中在接受的前缀上,而不是通常在第一次拒绝后被丢弃的整个块上,来提高草稿器预测令牌块的能力。在Qwen3_8B模型上的实验表明,Spec-AUF增加了令牌的平均发出长度,从而在多个基准测试中提高了性能。 AI

影响 提高了自回归生成的效率,可能导致AI模型响应速度更快。

排序理由 该条目是一篇详细介绍AI模型新训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的Spec-AUF训练方法提高了掩码块草稿器的性能

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Tianjian Yang, Meng Li ·

    Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

    arXiv:2607.01893v1 Announce Type: new Abstract: Speculative decoding accelerates autoregressive generation by drafting a block of tokens that the target model verifies left-to-right, committing only the longest accepted prefix. Block (DLM-style) drafters predict the whole block i…

  2. arXiv cs.CL TIER_1 English(EN) · Meng Li ·

    Spec-AUF: Accept-Until-Fail Training under Train-Inference Misalignment for Masked Block Drafters

    Speculative decoding accelerates autoregressive generation by drafting a block of tokens that the target model verifies left-to-right, committing only the longest accepted prefix. Block (DLM-style) drafters predict the whole block in parallel, which is fast but trained with a ful…