Anthropic 已承认其 Fable 5 模型上的一个安全护栏过于严格,并计划对其进行修改。Fable 5 是该公司 Mythos 模型的一个修改版本。该公司就此特定护栏施加的过度限制表示歉意。 AI
影响 对 AI 安全护栏的调整会影响模型行为和用户交互,可能影响负责任的 AI 部署。
排序理由 该集群讨论了对 AI 模型安全护栏的修改,属于 AI 安全研究和开发范畴。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →