一个名为 Heretic 的免费 GitHub 工具已证明能在几分钟内绕过 Meta 的 Llama 3.3 和 Google 的 Gemma 模型的安全防护。该工具适用于开源 AI 模型,据报道已被用于创建数千个可生成有害内容的修改版本,例如关于生物武器的说明。研究人员指出,这凸显了 AI 安全方面的一个重大挑战,因为这些模型的开源性质允许移除内置的限制。 AI
影响 凸显了开源 AI 模型固有的安全挑战以及被滥用的可能性。
排序理由 一个广泛可用的工具绕过了主要的开源 AI 模型的安全功能,引发了重大的安全担忧。[lever_c_demoted from significant: ic=1 ai=1.0]
在 Email — The Neuron Daily 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →