PulseAugur
实时 05:06:16
中文(ZH) 谷歌「AI联合数学家」来了!刷新最难数学AI基准SOTA,牛津教授用它解开群论悬案

谷歌DeepMind AI协助数学家,在FrontierMath基准测试中名列前茅

谷歌DeepMind发布了一个名为“AI Co-Mathematician”的AI系统,旨在与人类数学家合作解决复杂问题。该系统基于Gemini 3.1 Pro构建,在极具挑战性的FrontierMath Tier 4基准测试中取得了48%的新SOTA分数,显著优于GPT-5.5 Pro等现有模型。该AI作为一个异步工作空间,配备一个协调代理,负责分解任务、管理并行研究流,并持久存储失败的假设,这与软件开发中的工作流程相似。 AI

影响 该系统展示了AI在研究领域协作的新范式,有望加速数学等复杂领域的发现。

排序理由 该集群描述了一个用于数学研究的新AI系统及其在专业基准测试中的表现,包括其在解决先前未解决问题中的应用。

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

谷歌DeepMind AI协助数学家,在FrontierMath基准测试中名列前茅

报道来源 [2]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · 听雨 ·

    Google's 'AI Collaborating Mathematician' Arrives! It Breaks the SOTA on the Toughest Math AI Benchmark, and an Oxford Professor Used It to Solve a Long-Standing Problem in Group Theory

    谷歌AI for Math迈出最新一步

  2. Email — The Rundown AI TIER_1 English(EN) · bounces+31366032-637c-8d9utci1mq15fs7p9a4h=kill-the-newsletter.com@em8370.daily.therundown.ai (bounces+31366032-637c-8d9utci1mq15fs7p9a4h=kill-the-newsletter.com@em8370.daily.therundown.ai) ·

    🧮 Google DeepMind’s powerful AI co-mathematician

    <!--[if !mso]><!--><!--<![endif]-->🧮 Google DeepMind’s powerful AI co-mathematician<!--[if mso]><xml><o:OfficeDocumentSettings><o:AllowPNG></o:AllowPNG><o:PixelsPerInch>96</o:PixelsPerInch></o:OfficeDocumentSettings></xml><![endif]--><!--[if mso]><style type="text/css"> h1, h2, h…