新的EVA框架演进GUI代理的语义攻击

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员开发了EVA，一个旨在识别多模态大语言模型（MLLMs）驱动的GUI代理中语义漏洞的演进框架。该方法侧重于操纵代理的语义理解而非视觉感知，攻击成功率高达85%。EVA在模型的潜在空间中快速演进对抗性载荷，揭示了一个悖论：对齐训练反而可能使代理更容易受到欺骗性语义线索的影响。 AI

影响揭示了一个关键的对齐悖论，即经过指令遵循训练的代理容易受到语义欺骗的影响，这可能对未来的AI安全研究产生影响。

排序理由该集群包含一篇学术论文，详细介绍了一种红队测试AI代理的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yijie Lu, Manman Zhao, Tianjie Ju, Zihe Yan, Xinbei Ma, Yuan Guo, Daizong Ding, Gongshen Liu, Zhuosheng Zhang · 2026-06-08 04:00

EVA：为红队测试 GUI 代理对抗环境注入攻击而演进的语义对抗者

arXiv:2505.14289v2 Announce Type: replace Abstract: Graphical User Interface (GUI) agents powered by Multimodal Large Language Models (MLLMs) are increasingly deployed yet vulnerable to Environmental Injection Attacks (EIAs).However, current red-teaming methods are hindered by pr…