PulseAugur
实时 13:17:29
English(EN) How We Work Now

Anthropic 的 Opus 4.8 模型在编码和写作基准测试中名列前茅

Anthropic 发布了其最新模型 Opus 4.8,该模型在编码和写作测试中超越了之前的基准,成为该公司迄今为止能力最强的模型。此次发布标志着一项重大进展,因为 Anthropic 和 OpenAI 数月来一直在各种基准测试中展开激烈竞争。值得注意的是,Opus 4.8 的配套应用程序需要进一步开发才能完全匹配模型的性能。 AI

影响 在编码和写作基准测试中设定了新的 SOTA(当前最佳水平),加剧了与 OpenAI 的竞争,并凸显了模型能力与应用程序开发之间的差距。

排序理由 Anthropic 发布了具有基准性能声明的新模型版本(Opus 4.8)。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 Email — Every 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Anthropic 的 Opus 4.8 模型在编码和写作基准测试中名列前茅

报道来源 [1]

  1. Email — Every TIER_1 English(EN) · 0100019e7de79975-17abf721-d810-4dfa-8f11-0a84051c8413-000000@send.every.to (0100019e7de79975-17abf721-d810-4dfa-8f11-0a84051c8413-000000@send.every.to) ·

    我们现在的工作方式

    <!-- Set the language of your main document. This helps screenreaders use the proper language profile, pronunciation, and accent. --> <!-- The title is useful for screenreaders reading a document. Use your sender name or subject line. --> How We Work Now <!-- Never disable zoom b…