English(EN) Claude Fable 5 vs GPT-5.5 vs Gemini 3.1 Pro: Who Leads Now?

Anthropic 的 Claude Fable 5 在 AI 编码基准测试中领先，击败 GPT-5.5

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 07:06

Anthropic 的 Claude Fable 5 模型在编码基准测试中表现出卓越的性能，显著优于 OpenAI 的 GPT-5.5 和 Google 的 Gemini 3.1 Pro。在 SWE-Bench Pro 上，Fable 5 的成功率为 80.3%，而 GPT-5.5 为 58.6%，Gemini 3.1 Pro 为 54.2%。虽然 Fable 5 的定价高于 GPT-5.5，但其定位比 GPT-5.5 Pro 更具成本效益，以其成本提供了更好的编码性能。 AI

影响在编码基准测试中设定了新的 SOTA，给竞争对手带来压力，并可能加速 AI 驱动的编码任务的采用。

排序理由来自前沿实验室的新模型发布，附带基准测试结果。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 dev.to — Claude Code tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — Claude Code tag TIER_1 English(EN) · RAXXO Studios · 2026-06-10 07:06

Claude Fable 5 vs GPT-5.5 vs Gemini 3.1 Pro: Who Leads Now?

<ul> <li>SWE-Bench Pro: Claude Fable 5 hits 80.3 percent, GPT-5.5 lands 58.6, Gemini 3.1 Pro 54.2</li> <li>Gemini stays cheapest at 2 dollars per million input, Fable 5 costs 10 but undercuts GPT-5.5 Pro</li> <li>Only Anthropic ships a two-tier safety design: ris…

报道来源 [1]

Claude Fable 5 vs GPT-5.5 vs Gemini 3.1 Pro: Who Leads Now?

相关实体

相关话题