PulseAugur
实时 12:17:18
实体 formal math benchmarks

formal math benchmarks

PulseAugur coverage of formal math benchmarks — every cluster mentioning formal math benchmarks across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_124911 ·

    Mistral AI 发布 Leanstral 1.5 用于形式化数学和代码错误检测

    Mistral AI 发布了 Leanstral 1.5,这是一个开源模型,专为 Lean 4 环境中的形式化验证任务而设计。该模型在形式化数学基准测试中表现强劲。除了数学能力外,Leanstral 1.5 还成功在 57 个不同的开源代码存储库中识别出五个先前未发现的错误。