实体
miniF2F-test
miniF2F-test
PulseAugur coverage of miniF2F-test — every cluster mentioning miniF2F-test across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
AI frameworks boost formal theorem proving with new techniques
Researchers have developed new frameworks to enhance formal theorem proving capabilities using large language models. Goedel-Architect utilizes a blueprint generation and refinement strategy, achieving state-of-the-art …
-
知识图谱助力大型语言模型进行自动化定理证明
研究人员开发了KG-Prover,一个新框架,通过整合从数学文本中挖掘的知识图谱,增强大型语言模型进行自动化定理证明的能力。该方法有助于大型语言模型识别关键概念、理解它们之间的关系并更准确地形式化证明。在测试中,KG-Prover显著提高了大型语言模型的性能,在miniF2F-test数据集上提升高达21%,并在ProofNet和MUSTARD等其他基准测试中持续改进。