English(EN) Formalize Once, Edit the Rest: Efficient Lean-Based Answer Selection for Math Reasoning

新的BASE方法将LLM数学推理的形式化成本降低了5倍

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员开发了一种名为BASE的新方法，用于使用大型语言模型（LLM）和形式化证明助手Lean来提高数学推理任务中答案选择的效率。BASE通过形式化一个基础候选答案，然后编辑它来推导出其余的候选语句，而不是独立形式化每个答案，从而降低了计算成本。这种方法由一个名为LEANSCRIBE的重写器模型促进，同时提高了选择的准确性，并显著减少了自动形式化器的调用次数，在各种数据集和求解器上实现了帕累托改进。 AI

影响降低了基于LLM的数学推理的计算成本，可能能够更有效地验证和选择答案。

排序理由该集群包含一篇详细介绍基于LLM的数学推理新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Ji Feng, Zhouxing Shi · 2026-06-16 04:00

Formalize Once, Edit the Rest: Efficient Lean-Based Answer Selection for Math Reasoning

arXiv:2606.15972v1 Announce Type: cross Abstract: With large language models (LLMs) increasingly applied to mathematical reasoning, formal proof assistants such as Lean can be leveraged to verify reasoning outputs with machine-checkable rigor, enabling use cases such as answer se…

报道来源 [1]

Formalize Once, Edit the Rest: Efficient Lean-Based Answer Selection for Math Reasoning

相关实体

相关话题