谷歌DeepMind发布了一个名为“AI Co-Mathematician”的AI系统,旨在与人类数学家合作解决复杂问题。该系统基于Gemini 3.1 Pro构建,在极具挑战性的FrontierMath Tier 4基准测试中取得了48%的新SOTA分数,显著优于GPT-5.5 Pro等现有模型。该AI作为一个异步工作空间,配备一个协调代理,负责分解任务、管理并行研究流,并持久存储失败的假设,这与软件开发中的工作流程相似。 AI
影响 该系统展示了AI在研究领域协作的新范式,有望加速数学等复杂领域的发现。
排序理由 该集群描述了一个用于数学研究的新AI系统及其在专业基准测试中的表现,包括其在解决先前未解决问题中的应用。
- AI Co-Mathematician
- Alex Davies
- Claude Opus 4.6
- Claude Opus 4.7
- Daniel M. Roy
- Daniel Zheng
- Epoch AI
- FrontierMath Tier 4
- Gemini 3.1 Pro
- Google DeepMind
- GPT-5.4 Pro
- GPT-5.5 Pro
- Kourovka Notebook
- Marc Lackenby
- Pushmeet Kohli
- Claude Code
- Oxford
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →