实体
miniF2F
miniF2F
PulseAugur coverage of miniF2F — every cluster mentioning miniF2F across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
New AI method achieves 100% formal validity in theorem autoformalization
Researchers have developed a novel reference-free iterative refinement process for autoformalizing entire mathematical theorems. This method utilizes feedback from theorem provers and LLM-based judges to enhance formal …
-
Lean 4 自动形式化对表面措辞敏感,而非语义
研究人员调查了自然语言变体对 Lean 4 自动形式化的影响,发现语义等价的释义可能导致不同的形式化输出。他们的研究使用 GPT 系列模型和开源自动形式化器在 ProofNet# 和 miniF2F 数据集上进行,揭示了这些敏感性主要是由于编译失败而非语义分歧。研究结果表明,未来的努力应侧重于改进编译过程,而不是这些系统的语义层。