一个名为 Goedel-Architect 的新框架,由 DeepSeek V4 驱动,在 PutnamBench 数学竞赛中取得了 75.6% 的通过率。该框架具有显著的成本优势,成本仅为 294 美元,而类似系统的成本为 170,000 美元。研究人员将性能提升归因于架构创新,而非更优越的硬件。 AI
影响 展示了 AI 在复杂数学推理方面显著的成本效益改进。
排序理由 一个研究团队使用 AI 模型和新框架取得了值得注意的基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — sigmoid.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →