PulseAugur
实时 14:55:17
English(EN) Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

新的LenVM模型为LLM提供令牌级长度控制

研究人员开发了一个名为长度值模型(LenVM)的新框架,该框架可预测大型语言模型中令牌的剩余生成长度。这种令牌级方法将长度建模为值估计问题,提供了一个密集、无注释的监督信号。实验表明,LenVM在LIFEBench任务上显著提高了精确长度匹配,并允许在性能和效率之间进行受控的权衡,即使在严格的令牌预算下也能在GSM8K上保持高精度。 AI

影响 能够实现更高效、可控的文本生成,有可能提高LLM在需要特定输出长度的任务上的性能。

排序理由 介绍LLM新建模技术的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的LenVM模型为LLM提供令牌级长度控制

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Zhen Zhang, Changyi Yang, Zijie Xia, Zhen Yang, Chengzhi Liu, Zhaotiao Weng, Yepeng Liu, Haobo Chen, Jin Pan, Chenyang Zhao, Yuheng Bu, Alkesh Patel, Zhe Gan, Xin Eric Wang ·

    Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

    arXiv:2604.27039v1 Announce Type: new Abstract: Token serves as the fundamental unit of computation in modern autoregressive models, and generation length directly influences both inference cost and reasoning performance. Despite its importance, existing approaches lack fine-grai…