Anthropic 公司正在发布 Claude Opus 4.8,这是一个旨在更加诚实且不易做出无根据声明的新模型。据报道,该版本在忽略生成的代码缺陷方面比其前代产品可能性低四倍。此次更新还引入了一项功能,允许用户控制响应的努力程度,平衡质量和 token 使用量,以及一个用于通过并行子代理处理更大、更复杂任务的“动态工作流”预览。 AI
影响 通过减少无根据的声明和改进代码缺陷检测来增强 AI 的可靠性,从而可能增加对 AI 系统的信任。
排序理由 Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=2 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →