Anthropic 推出了 Claude Fable 5,这是一个定位为可安全广泛公众访问的新模型,其安全措施旨在将敏感查询路由到更受限制的模型 Claude Opus 4.8。该公司声称这些安全措施在不到 5% 的会话中触发,允许大多数用户直接体验 Fable 5。然而,Anthropic 承认对手将试图规避这些安全措施,使其模型的安全性以及检测和修复故障的能力成为其评估的关键方面。 AI
影响 为平衡前沿模型能力与公众安全设定了新标准,可能影响未来的 AI 发布策略。
排序理由 带有系统卡的 Frontier-lab 模型发布。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →