Anthropic 发布了 Claude Opus 4.8,据报道,该新模型在各种任务上,尤其是在涉及长上下文窗口的任务上,表现优于 GPT-5.5 和 Gemini 3.1 Pro。该模型在 SWE-bench 基准测试中取得了显著分数,表明其在代码生成和理解方面表现强劲。 AI
影响 为长上下文性能设定了新基准,可能影响未来的模型开发和应用设计。
排序理由 前沿实验室发布新模型,附带性能基准测试。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →