PulseAugur
实时 11:52:55

新的EVA框架演进GUI代理的语义攻击

研究人员开发了EVA,一个旨在识别多模态大语言模型(MLLMs)驱动的GUI代理中语义漏洞的演进框架。该方法侧重于操纵代理的语义理解而非视觉感知,攻击成功率高达85%。EVA在模型的潜在空间中快速演进对抗性载荷,揭示了一个悖论:对齐训练反而可能使代理更容易受到欺骗性语义线索的影响。 AI

影响 揭示了一个关键的对齐悖论,即经过指令遵循训练的代理容易受到语义欺骗的影响,这可能对未来的AI安全研究产生影响。

排序理由 该集群包含一篇学术论文,详细介绍了一种红队测试AI代理的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Yijie Lu, Manman Zhao, Tianjie Ju, Zihe Yan, Xinbei Ma, Yuan Guo, Daizong Ding, Gongshen Liu, Zhuosheng Zhang ·

    EVA:为红队测试 GUI 代理对抗环境注入攻击而演进的语义对抗者

    arXiv:2505.14289v2 Announce Type: replace Abstract: Graphical User Interface (GUI) agents powered by Multimodal Large Language Models (MLLMs) are increasingly deployed yet vulnerable to Environmental Injection Attacks (EIAs).However, current red-teaming methods are hindered by pr…