English(EN) Structure-Guided Visual Perturbation Neutralization for LVLMs

新的防御和基准测试针对LVLM视觉输入漏洞

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-28 04:00

研究人员开发了新的方法来解决大型视觉语言模型（LVLM）的漏洞。其中一种方法SIGN是一个轻量级防御框架，它利用结构提取和动态中和来抑制图像输入中的对抗性扰动，以最小的像素修改和计算开销实现了高防御成功率。另一项开发是MVI-Bench，这是一个全面的基准测试，旨在评估LVLM在不同层级上抵御误导性视觉输入的鲁棒性，揭示了当前最先进模型存在的显著漏洞。 AI

影响新的基准测试和防御机制对于LVLM在实际应用中的安全可靠部署至关重要。

排序理由两篇研究论文介绍了用于LVLM鲁棒性的新方法和基准测试。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Yuanhe Zhang, Xueting Wang, YanBin Ren, Haoran Gao, Xinhan Zheng, Zhenhong Zhou, Fanyu Meng, Li Sun, Sen Su · 2026-05-28 04:00

Structure-Guided Visual Perturbation Neutralization for LVLMs

arXiv:2605.27927v1 Announce Type: cross Abstract: Image inputs enable Large Vision Language Models (LVLMs) to perceive fine-grained visual information, but also introduce a pixel-level attack surface through which adversarial perturbations can elicit unsafe model behaviors. Howev…
arXiv cs.CV TIER_1 English(EN) · Huiyi Chen, Jiawei Peng, Dehai Min, Changchang Sun, Kaijie Chen, Yan Yan, Xu Yang, Lu Cheng · 2026-05-28 04:00

MVI-Bench: A Comprehensive Benchmark for Evaluating Robustness to Misleading Visual Inputs in LVLMs

arXiv:2511.14159v3 Announce Type: replace Abstract: Evaluating the robustness of Large Vision-Language Models (LVLMs) is essential for their continued development and responsible deployment in real-world applications. However, existing robustness benchmarks typically focus on hal…

报道来源 [2]

Structure-Guided Visual Perturbation Neutralization for LVLMs

MVI-Bench: A Comprehensive Benchmark for Evaluating Robustness to Misleading Visual Inputs in LVLMs

相关实体

相关话题