BlindGuard 为 LLM 多智能体系统提供针对未知攻击的无监督防御

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出了一种新颖的无监督防御机制 BlindGuard，旨在保护基于大型语言模型（LLM）的多智能体系统（MAS）免受未知攻击。该方法解决了恶意智能体通过消息交换破坏集体决策的传播漏洞。与需要标记攻击数据的监督方法不同，BlindGuard 使用分层编码器和具有对比学习的腐败引导检测器，仅从正常的智能体行为中学习。 AI

影响为保护基于 LLM 的多智能体系统免受新型攻击向量提供了新的无监督方法。

排序理由介绍 LLM 多智能体系统新防御机制的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Rui Miao, Yixin Liu, Yili Wang, Xu Shen, Yue Tan, Yiwei Dai, Shirui Pan, Xin Wang · 2026-04-28 04:00

BlindGuard：在未知攻击下保护基于LLM的多智能体系统

arXiv:2508.08127v2 Announce Type: replace Abstract: The security of LLM-based multi-agent systems (MAS) is critically threatened by propagation vulnerability, where malicious agents can distort collective decision-making through inter-agent message interactions. While existing su…

报道来源 [1]

BlindGuard：在未知攻击下保护基于LLM的多智能体系统

相关实体

相关话题