研究人员开发了一种名为“受控释放提示”(controlled-release prompting)的新攻击方法,可以绕过主流 AI 聊天平台的提示防护。该技术利用输入过滤器和主 AI 模型之间的速度差异,生成过滤器无法检测但 LLM 可以理解的恶意提示。该攻击成功地针对 Google Gemini、DeepSeek Chat、xAI Grok 和 Mistral Le Chat,甚至被用于从 Gemini 中提取受版权保护的数据。 AI
影响 此次攻击凸显了当前 AI 安全机制的一个重大漏洞,可能导致恶意使用和跨多个平台的数据提取。
排序理由 该集群包含一篇详细介绍针对 AI 安全过滤器的 A 新攻击方法的 ist 研究论文。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →