PulseAugur
实时 11:41:26
实体 FrontierMath Tier 4

FrontierMath Tier 4

PulseAugur coverage of FrontierMath Tier 4 — every cluster mentioning FrontierMath Tier 4 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_23974 ·

    谷歌DeepMind AI协助数学家,在FrontierMath基准测试中名列前茅

    谷歌DeepMind发布了一个名为“AI Co-Mathematician”的AI系统,旨在与人类数学家合作解决复杂问题。该系统基于Gemini 3.1 Pro构建,在极具挑战性的FrontierMath Tier 4基准测试中取得了48%的新SOTA分数,显著优于GPT-5.5 Pro等现有模型。该AI作为一个异步工作空间,配备一个协调代理,负责分解任务、管理并行研究流,并持久存储失败的假设,这与软件开发中的工作流程相似。