English(EN) CASPIAN: Online Detection and Attribution of Cascade Attacks in LLM Multi-Agent Systems via Cross-Channel Causal Monitoring

新框架检测LLM多智能体系统中的级联攻击

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 01:16

研究人员开发了CASPIAN，一个旨在检测和归因大型语言模型（LLM）驱动的多智能体系统中级联攻击的新型框架。这些攻击涉及跨智能体的对抗性影响传播，导致系统范围内的故障，由于其分布式和互联的性质，这些故障难以识别。CASPIAN通过一个动态因果影响矩阵对智能体交互进行建模，并利用晚期交互条件转移熵公式进行估计，从而实现跨通道因果分析。该方法能够识别攻击的源头、桥梁和放大器智能体，以及其传播路径，在准确性和早期检测方面优于现有防御措施，且延迟开销极小。 AI

影响这项研究引入了一种新的方法来保护基于LLM的多智能体系统免受复杂的级联攻击，有可能提高AI智能体在复杂交互中的可靠性。

排序理由该集群描述了一篇详细介绍LLM多智能体系统攻击检测和归因新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.MA (Multiagent) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.MA (Multiagent) TIER_1 English(EN) · Jiaming Cui · 2026-05-19 01:16

CASPIAN：通过跨通道因果监控在线检测和归因LLM多智能体系统中的级联攻击

Cascade attacks in LLM multi-agent systems (MAS) arise when adversarial influence propagates across agents and leads to escalated system-level failures through complex agent interactions. Detecting such cascades is challenging, as their signals are distributed, tightly coupled ac…

报道来源 [1]

CASPIAN：通过跨通道因果监控在线检测和归因LLM多智能体系统中的级联攻击

相关实体

相关话题