PulseAugur
实时 14:31:56
实体 PutnamBench

PutnamBench

PulseAugur coverage of PutnamBench — every cluster mentioning PutnamBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_65645 ·

    新框架ECP形式化求解数学答案构造问题

    研究人员开发了一个名为Enumerate-Conjecture-Prove (ECP) 的新神经符号框架,旨在解决形式数学中的答案构造问题。该框架结合了用于提出候选答案的通用大语言模型和用于生成机器检查证明的专用证明器LLM。ECP在基准数据集上取得了成功,形式化地解决了部分具有可接受答案和证明的答案构造问题,其表现优于现有的LLM基线。

  2. TOOL · CL_62835 ·

    New framework boosts formal theorem provers using compiler outputs

    Researchers have developed a new framework to improve the efficiency of formal theorem provers by leveraging compiler outputs. This method uses a learning-to-refine approach that exploits the compression of diverse proo…