研究人员发现了一种在采用自带密钥(BYOK)系统的LLM代理架构中的新漏洞。这些架构通过第三方中继路由LLM流量,造成了一个完整性缺口,恶意中继可以在对齐后、代理执行前篡改LLM响应。这种“中继篡改攻击”(RTA)可以成功修改消息,使即使是对齐的LLM也失效,在各种LLM和代理环境中,攻击成功率高达99.1%。 AI
影响 突显了LLM代理架构中的一个关键安全漏洞,可能影响AI驱动的自动化的可信度和可靠性。
排序理由 这是一篇详细介绍LLM代理新攻击向量的研究论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →