English(EN) Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

通过词汇丢弃提升 LLM 协同进化，以实现持续多样性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-29 04:00

研究人员开发了一种称为词汇丢弃的技术，以解决协同进化语言模型训练中的多样性崩溃问题。该方法通过对提议者模型的输出 logits 应用随机掩码，防止其生成重复性问题。在数学推理任务上使用 Qwen3-4B 和 Qwen3-8B 模型进行的实验表明，词汇丢弃保持了提议者的多样性，并显著提高了求解器的性能，尤其是在具有挑战性的基准测试上。 AI

影响引入了一种提高 LLM 训练多样性和推理任务性能的方法。

排序理由这是一篇详细介绍 LLM 训练新技术的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Jacob Dineen, Aswin RRV, Zhikun Xu, Ben Zhou · 2026-04-29 04:00

Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

arXiv:2604.03472v2 Announce Type: replace Abstract: Co-evolutionary self-play, where one language model generates problems and another solves them, promises autonomous curriculum learning without human supervision. In practice, the proposer quickly converges to a narrow distribut…

报道来源 [1]

Vocabulary Dropout for Curriculum Diversity in LLM Co-Evolution

相关实体

相关话题