PulseAugur
实时 13:56:42
English(EN) DeepSeek V4 is powering a new framework called Goedel-Architect that achieves a 75.6% pass rate on the PutnamBench mathematics competition at just 294 USD - com

DeepSeek V4 驱动 Goedel-Architect 在低成本下赢得数学竞赛

一个名为 Goedel-Architect 的新框架,由 DeepSeek V4 驱动,在 PutnamBench 数学竞赛中取得了 75.6% 的通过率。该框架具有显著的成本优势,成本仅为 294 美元,而类似系统的成本为 170,000 美元。研究人员将性能提升归因于架构创新,而非更优越的硬件。 AI

影响 展示了 AI 在复杂数学推理方面显著的成本效益改进。

排序理由 一个研究团队使用 AI 模型和新框架取得了值得注意的基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — sigmoid.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] ·

    DeepSeek V4 为名为 Goedel-Architect 的新框架提供支持,该框架在 PutnamBench 数学竞赛中通过率达到 75.6%,成本仅为 294 美元

    DeepSeek V4 is powering a new framework called Goedel-Architect that achieves a 75.6% pass rate on the PutnamBench mathematics competition at just 294 USD - compared to 170,000 USD for comparable systems, a 500-fold cost advantage. The Princeton University team says the architect…