PulseAugur
实时 16:09:25
实体 miniF2F-test

miniF2F-test

PulseAugur coverage of miniF2F-test — every cluster mentioning miniF2F-test across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_62835 ·

    AI frameworks boost formal theorem proving with new techniques

    Researchers have developed new frameworks to enhance formal theorem proving capabilities using large language models. Goedel-Architect utilizes a blueprint generation and refinement strategy, achieving state-of-the-art …

  2. TOOL · CL_51302 ·

    知识图谱助力大型语言模型进行自动化定理证明

    研究人员开发了KG-Prover,一个新框架,通过整合从数学文本中挖掘的知识图谱,增强大型语言模型进行自动化定理证明的能力。该方法有助于大型语言模型识别关键概念、理解它们之间的关系并更准确地形式化证明。在测试中,KG-Prover显著提高了大型语言模型的性能,在miniF2F-test数据集上提升高达21%,并在ProofNet和MUSTARD等其他基准测试中持续改进。