研究人员开发了CASPIAN,一个旨在检测和归因大型语言模型(LLM)驱动的多智能体系统中级联攻击的新型框架。这些攻击涉及跨智能体的对抗性影响传播,导致系统范围内的故障,由于其分布式和互联的性质,这些故障难以识别。CASPIAN通过一个动态因果影响矩阵对智能体交互进行建模,并利用晚期交互条件转移熵公式进行估计,从而实现跨通道因果分析。该方法能够识别攻击的源头、桥梁和放大器智能体,以及其传播路径,在准确性和早期检测方面优于现有防御措施,且延迟开销极小。 AI
影响 这项研究引入了一种新的方法来保护基于LLM的多智能体系统免受复杂的级联攻击,有可能提高AI智能体在复杂交互中的可靠性。
排序理由 该集群描述了一篇详细介绍LLM多智能体系统攻击检测和归因新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 arXiv cs.MA (Multiagent) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →