Anthropic 发布了 Claude Fable 5,与前代 Opus 4.8 相比,新模型在编码和长时推理等复杂任务上性能显著提升。虽然 Fable 5 的每 token 价格是 Opus 4.8 的两倍,但其增强的功能,尤其是在 SWE-Bench Pro 和 FrontierCode 等基准测试中的表现,表明对于要求苛刻的工作负载,它可能更具成本效益。新模型还具有更低的缓存最小值和一些 API 差异,例如禁用了明确的“思考”参数。 AI
影响 为复杂的推理和编码任务设定了新的性能级别,可能证明专业应用更高的成本是合理的。
排序理由 Anthropic 发布的新模型,包含性能基准测试。[lever_c_demoted from frontier_release: ic=2 ai=1.0]
在 dev.to — Claude Code tag 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →