PulseAugur
实时 10:51:09
English(EN) Formalize Once, Edit the Rest: Efficient Lean-Based Answer Selection for Math Reasoning

新的BASE方法将LLM数学推理的形式化成本降低了5倍

研究人员开发了一种名为BASE的新方法,用于使用大型语言模型(LLM)和形式化证明助手Lean来提高数学推理任务中答案选择的效率。BASE通过形式化一个基础候选答案,然后编辑它来推导出其余的候选语句,而不是独立形式化每个答案,从而降低了计算成本。这种方法由一个名为LEANSCRIBE的重写器模型促进,同时提高了选择的准确性,并显著减少了自动形式化器的调用次数,在各种数据集和求解器上实现了帕累托改进。 AI

影响 降低了基于LLM的数学推理的计算成本,可能能够更有效地验证和选择答案。

排序理由 该集群包含一篇详细介绍基于LLM的数学推理新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Ji Feng, Zhouxing Shi ·

    Formalize Once, Edit the Rest: Efficient Lean-Based Answer Selection for Math Reasoning

    arXiv:2606.15972v1 Announce Type: cross Abstract: With large language models (LLMs) increasingly applied to mathematical reasoning, formal proof assistants such as Lean can be leveraged to verify reasoning outputs with machine-checkable rigor, enabling use cases such as answer se…