研究人员开发了“SilentRetrieval”,这是一种旨在破坏检索增强生成 (RAG) 系统的新型两阶段攻击。该方法使用对抗性数据投毒注入经过处理的文档,这些文档在语义上得以保留且流畅,使其难以检测。该攻击在劫持各种基准测试和 LLM 的 RAG 输出方面取得了很高的成功率,即使在低投毒率下也是如此,尽管防御措施会以牺牲延迟为代价来减轻其有效性。 AI
影响 突出了 RAG 系统中的关键安全漏洞,可能影响 AI 生成内容的可靠性和可信度。
排序理由 该集群包含一篇详细介绍针对 RAG 系统的新型攻击方法的 ist 研究论文。
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →