Anthropic 发布了名为 Claude Mythos-class 的新前沿模型,该模型包含一种新颖的“关闭开关”功能,旨在禁用其最危险的能力。这一发展标志着人工智能安全方面迈出了重要一步,提供了一种控制潜在有害功能的内置机制。 AI
影响 为前沿模型引入了新颖的安全机制,可能影响未来人工智能的发展和监管。
排序理由 前沿实验室模型发布,附带系统卡。[lever_c 从 frontier_release 降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →