English(EN) How We Work Now

Anthropic 的 Opus 4.8 模型在编码和写作基准测试中名列前茅

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-31 11:59

Anthropic 发布了其最新模型 Opus 4.8，该模型在编码和写作测试中超越了之前的基准，成为该公司迄今为止能力最强的模型。此次发布标志着一项重大进展，因为 Anthropic 和 OpenAI 数月来一直在各种基准测试中展开激烈竞争。值得注意的是，Opus 4.8 的配套应用程序需要进一步开发才能完全匹配模型的性能。 AI

影响在编码和写作基准测试中设定了新的 SOTA（当前最佳水平），加剧了与 OpenAI 的竞争，并凸显了模型能力与应用程序开发之间的差距。

排序理由 Anthropic 发布了具有基准性能声明的新模型版本（Opus 4.8）。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 Email — Every 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Email — Every TIER_1 English(EN) · 0100019e7de79975-17abf721-d810-4dfa-8f11-0a84051c8413-000000@send.every.to (0100019e7de79975-17abf721-d810-4dfa-8f11-0a84051c8413-000000@send.every.to) · 2026-05-31 11:59

我们现在的工作方式

  How We Work Now <!-- Never disable zoom b…

报道来源 [1]

我们现在的工作方式

相关实体

相关话题