English(EN) When the Manual Lies: A Realistic Benchmark to Evaluate MCP Poisoning Attacks for LLM Agents

新基准揭示LLM代理易受元数据投毒攻击

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员引入了一个新的基准MCP-TDP安全基准，用于评估一种名为工具描述投毒（TDP）的新型攻击向量，该向量针对LLM代理。这种攻击通过改变工具的元数据来操纵代理的理解，导致严重的漏洞。在测试中，GPT-4o等领先模型在高风险场景下攻击成功率接近100%，而标准防御措施则被证明基本无效。 AI

影响这项研究突显了LLM代理中存在的关键安全缺陷，可能影响自主系统的开发和部署。

排序理由该集群包含一篇学术论文，详细介绍了针对LLM代理的新安全基准和攻击向量。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Shi Liu, Xuehai Tang, Xikang Yang, Liang Lin, Biyu Zhou, Wenjie Xiao, Wantao Liu · 2026-05-26 04:00

When the Manual Lies: A Realistic Benchmark to Evaluate MCP Poisoning Attacks for LLM Agents

arXiv:2605.24069v1 Announce Type: cross Abstract: The rise of tool-using Large Language Model (LLM) agents, standardized by protocols like the Model Context Protocol (MCP), has unlocked unprecedented autonomous execution capabilities for LLM Agents by integrating external open-do…