PulseAugur
实时 09:29:57
English(EN) Claude Fable 5 vs GPT-5.5 vs Gemini 3.1 Pro: Who Leads Now?

Anthropic 的 Claude Fable 5 在 AI 编码基准测试中领先,击败 GPT-5.5

AnthropicClaude Fable 5 模型在编码基准测试中表现出卓越的性能,显著优于 OpenAIGPT-5.5GoogleGemini 3.1 Pro。在 SWE-Bench Pro 上,Fable 5 的成功率为 80.3%,而 GPT-5.5 为 58.6%,Gemini 3.1 Pro 为 54.2%。虽然 Fable 5 的定价高于 GPT-5.5,但其定位比 GPT-5.5 Pro 更具成本效益,以其成本提供了更好的编码性能。 AI

影响 在编码基准测试中设定了新的 SOTA,给竞争对手带来压力,并可能加速 AI 驱动的编码任务的采用。

排序理由 来自前沿实验室的新模型发布,附带基准测试结果。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 dev.to — Claude Code tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — Claude Code tag TIER_1 English(EN) · RAXXO Studios ·

    Claude Fable 5 vs GPT-5.5 vs Gemini 3.1 Pro: Who Leads Now?

    <ul> <li><p>SWE-Bench Pro: Claude Fable 5 hits 80.3 percent, GPT-5.5 lands 58.6, Gemini 3.1 Pro 54.2</p></li> <li><p>Gemini stays cheapest at 2 dollars per million input, Fable 5 costs 10 but undercuts GPT-5.5 Pro</p></li> <li><p>Only Anthropic ships a two-tier safety design: ris…