研究人员开发了一个名为长度值模型(LenVM)的新框架,该框架可预测大型语言模型中令牌的剩余生成长度。这种令牌级方法将长度建模为值估计问题,提供了一个密集、无注释的监督信号。实验表明,LenVM在LIFEBench任务上显著提高了精确长度匹配,并允许在性能和效率之间进行受控的权衡,即使在严格的令牌预算下也能在GSM8K上保持高精度。 AI
影响 能够实现更高效、可控的文本生成,有可能提高LLM在需要特定输出长度的任务上的性能。
排序理由 介绍LLM新建模技术的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →