研究人员推出了一种新颖的解码程序——熵门控潜在递归(EGLR),旨在通过扩展传统token级随机性之外的采样空间来增强语言模型的推理能力。EGLR通过在高度不确定的token上递归地重新应用模型的顶层解码器层来引入一个确定性轴,为温度采样创造了一个互补的维度。这种结合方法在指令调整模型和数学推理基准上进行了测试,显著提高了性能,证明了层跨度轴捕获了独特的问题解决能力。 AI
影响 引入了一种新颖的解码策略,可以通过扩展采样空间来增强LLM在复杂推理任务上的性能。
排序理由 该集群包含一篇详细介绍语言模型推理新方法的论文。
- Dushyant Singh Chauhan
- Entropy-Gated Latent Recursion
- MATH-500
- Qwen2.5-3B-Instruct
- alphaXiv
- arXiv
- CatalyzeX
- DagsHub
- Gotit.pub
- Hugging Face
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →