Anthropic 发布了 Claude Fable 5,这是一款新的 Frontier 模型,在推理、编码和创意任务方面展示了显著的进步。早期测试表明,Fable 5 在复制 Twitter 界面和生成复杂的创意内容等复杂任务上优于 GPT-5.5 等竞争对手。该模型在基准测试中的表现也实现了巨大飞跃,在 SWE-Bench Pro 等评估中超越了之前的趋势,尽管其高级功能带来了高昂的运营成本。 AI
影响 在编码和创意基准测试中设定了新的 SOTA,可能颠覆现有的创意工具并加速企业采用高级 AI 代理。
排序理由 Frontier-lab 模型发布,附带系统卡和基准数据。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →