一位研究人员透露,Fable 5 AI 模型据称被一个简单的“修复此代码”提示“吓坏了”,这与研究论文的初步解读相反。这个提示不涉及越狱技术,显然导致模型表现出意想不到的行为。这些发现表明该模型在响应直接的编码请求时可能存在漏洞或敏感性。 AI
影响 凸显了先进 AI 模型中潜在的意外行为,表明需要进行更细致的安全测试,超越传统的越狱。
排序理由 该条目讨论了研究人员对一篇关于 AI 模型行为的论文的解读,而不是直接发布或基准测试。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →