Anthropic 发布了其新的 Claude 4 模型系列,包括 Claude Opus 4 和 Claude Sonnet 4。其中 Opus 4 模型被特别强调为领先的编程任务 AI,在 SWE-bench 基准测试中取得了 72.5% 的分数。这一新模型系列提供了增强的功能,如长时任务支持、多会话记忆以及与 GitHub 和 VS Code 等流行开发工具的深度集成,可能将开发者的角色转向指导 AI 代码生成。 AI
影响 为 AI 编码助手设定了新的基准,可能将开发者的工作流程转变为 AI 指导。
排序理由 来自前沿实验室 (Anthropic) 的新模型发布,附带基准测试结果。 [lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →