PulseAugur
实时 02:05:29
English(EN) Claude Opus 4.8 shipped today. Here's the upgrade decision tree the announcement skipped — and three workloads that should stay on 4.7.

Anthropic 发布 Claude Opus 4.8,基准测试有所提升,用户需谨慎

Anthropic 发布了 Claude Opus 4.8,这是一个增量更新,在编码、推理和长上下文检索等各种基准测试中均有所改进。新版本在超过 100,000 个 token 的上下文方面具有更好的连贯性,工具使用延迟降低了 15%,并改进了对边缘请求的拒绝校准。然而,用户需注意,长系统提示、流式行为和工具选择先验的变化可能需要对现有的生产工作负载进行重新调整。 AI

影响 由于系统提示处理和工具选择的变化,需要对生产工作负载进行仔细重新评估。

排序理由 前沿实验室发布新模型。 [lever_c_从 frontier_release 降级:ic=1 ai=1.0]

在 dev.to — Anthropic tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — Anthropic tag TIER_1 English(EN) · LayerZero ·

    Claude Opus 4.8 今日发布。以下是发布公告中跳过的升级决策树——以及三个应继续使用 4.7 的工作负载。

    <h2> The 30-second version </h2> <p>Anthropic shipped Claude Opus 4.8 a few hours ago. Every benchmark on the announcement page is up: SWE-bench Verified, GPQA, MATH-500, the agentic tool-use evals. The marketing copy reads as it always does — "our most capable model", "strongest…