Anthropic 发布了其最新模型 Opus 4.8,该模型在编码和写作测试中超越了之前的基准,成为该公司迄今为止能力最强的模型。此次发布标志着一项重大进展,因为 Anthropic 和 OpenAI 数月来一直在各种基准测试中展开激烈竞争。值得注意的是,Opus 4.8 的配套应用程序需要进一步开发才能完全匹配模型的性能。 AI
影响 在编码和写作基准测试中设定了新的 SOTA(当前最佳水平),加剧了与 OpenAI 的竞争,并凸显了模型能力与应用程序开发之间的差距。
排序理由 Anthropic 发布了具有基准性能声明的新模型版本(Opus 4.8)。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →