English(EN) EntropyScan: Towards Model-level Backdoor Detection in LVLMs via Visual Attention Entropy

EntropyScan 通过视觉注意力异常检测 LVLM 后门

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-15 08:01

研究人员开发了 EntropyScan，一种检测大型视觉语言模型 (LVLM) 中后门的新方法。该方法是模型级别的，不需要了解训练数据或特定的攻击触发器。EntropyScan 通过分析 LVLM 在处理良性样本时视觉注意力分配中的异常来识别后门，这表明跨模态对齐受到干扰。该方法利用 Tsallis 熵来量化这些失真，在实验中取得了高精度。 AI

影响引入了一种检测视觉语言模型安全漏洞的新方法，这对于安全部署至关重要。

排序理由学术论文，介绍了一种检测 LVLM 后门的新方法。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Xilin Chen · 2026-05-15 08:01

EntropyScan: Towards Model-level Backdoor Detection in LVLMs via Visual Attention Entropy

Large Vision-Language Models (LVLMs) have demonstrated remarkable capabilities across various tasks, yet they remain vulnerable to backdoor attacks. Existing defense methods predominantly focus on sample-level defense, which relies on the knowledge of training data or triggers. H…

报道来源 [1]

EntropyScan: Towards Model-level Backdoor Detection in LVLMs via Visual Attention Entropy

相关实体

相关话题