两篇新的研究论文提出通过分析大型语言模型(LLM)在推理过程中的置信度水平来优化其推理时间的方法。第一篇论文 EAGer 使用了 token 级熵来动态分配计算资源,仅在不确定性高时才分支到多个推理路径。第二篇论文置信度动态增益(CDG)观察到,正确的推理轨迹往往会随着时间的推移而提高置信度,而错误的轨迹则会下降,并利用这种动态来选择更好的答案。这两种方法在复杂推理基准测试中都显示出显著的性能提升和计算量减少。 AI
影响 这些方法可以通过减少复杂推理任务中的冗余计算,从而实现更高效、性能更强的 LLM。
排序理由 两篇在 arXiv 上发表的学术论文,提出了优化 LLM 推理的新颖方法。
- AIME 2025
- AIME24/25
- BRUMO25
- Confidence Dynamic Gain (CDG)
- DeepSeek-R1
- EAGer
- Gemma-3
- gpt-oss
- HMMT25
- Qwen-QwQ
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →