PulseAugur
实时 12:51:49
English(EN) MerLean-Prover: A Recursive Looping Harness for End-to-End Lean 4 Theorem Proving

新的 Lean 4 定理证明器取得强劲的基准测试结果

研究人员开发了 MerLean-Prover,一个用于 Lean 4 的端到端定理证明器,可生成可由内核检查的证明。该系统利用一个包含三种代理类型(规划、检查和 Lean)的递归循环,并在 FormalQualBenchPutnam2025 等基准测试中展现出强劲的性能。值得注意的是,MerLean-Prover 在 FormalQualBench 上取得了 10/23 的成绩,优于现有的开源基线,并以更少的计算时间成功解决了 Putnam2025 上的所有 12 个问题。该工具设计对 SonnetHaiku 等较小模型也同样有效。 AI

排序理由 该集群包含一篇详细介绍新型定理证明系统及其基准测试结果的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Jinzheng Li, Zeru Zhu, Yuanjie Ren ·

    MerLean-Prover:一种用于端到端 Lean 4 证明的递归循环工具

    arXiv:2605.26959v1 Announce Type: cross Abstract: MerLean-Prover is an end-to-end Lean4 theorem prover that replaces sorry declarations with kernel-checkable proofs. It is built from three agent types (Planning, Check, and Lean) composed by a recursive outer loop whose unit of re…

  2. arXiv cs.CL TIER_1 English(EN) · Yuanjie Ren ·

    MerLean-Prover:一种用于端到端 Lean 4 证明的递归循环工具

    MerLean-Prover is an end-to-end Lean4 theorem prover that replaces sorry declarations with kernel-checkable proofs. It is built from three agent types (Planning, Check, and Lean) composed by a recursive outer loop whose unit of revision is the proof plan itself, and uses no fine-…