English(EN) Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

新的LenVM模型为LLM提供令牌级长度控制

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-01 04:00

研究人员开发了一个名为长度值模型（LenVM）的新框架，该框架可预测大型语言模型中令牌的剩余生成长度。这种令牌级方法将长度建模为值估计问题，提供了一个密集、无注释的监督信号。实验表明，LenVM在LIFEBench任务上显著提高了精确长度匹配，并允许在性能和效率之间进行受控的权衡，即使在严格的令牌预算下也能在GSM8K上保持高精度。 AI

影响能够实现更高效、可控的文本生成，有可能提高LLM在需要特定输出长度的任务上的性能。

排序理由介绍LLM新建模技术的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Zhen Zhang, Changyi Yang, Zijie Xia, Zhen Yang, Chengzhi Liu, Zhaotiao Weng, Yepeng Liu, Haobo Chen, Jin Pan, Chenyang Zhao, Yuheng Bu, Alkesh Patel, Zhe Gan, Xin Eric Wang · 2026-05-01 04:00

Length Value Model：可扩展的用于 Token 级长度建模的价值预训练

arXiv:2604.27039v1 Announce Type: new Abstract: Token serves as the fundamental unit of computation in modern autoregressive models, and generation length directly influences both inference cost and reasoning performance. Despite its importance, existing approaches lack fine-grai…

报道来源 [1]

Length Value Model：可扩展的用于 Token 级长度建模的价值预训练

相关实体

相关话题