English(EN) From Internal Diagnosis to External Auditing: A VLM-Driven Paradigm for Data-Free Online Backdoor Defense

新的VLM驱动防御框架PRISM针对后门攻击

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 04:00

研究人员推出了一种新颖的框架PRISM，用于防御深度神经网络中的后门攻击。该方法将内部模型诊断转向外部语义审计，利用通用视觉语言模型（VLM）作为独立的安保审计员。PRISM在线优化视觉原型，并使用自适应路由器进行实时阈值校准，在抑制攻击成功率的同时保持干净准确率方面表现出最先进的性能。 AI

影响引入了一种新颖的、外部化的后门攻击防御机制，可能增强已部署AI模型的安全性。

排序理由该集群包含一篇详细介绍深度神经网络新防御机制的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Binyan Xu, Fan Yang, Xilin Dai, Di Tang, Kehuan Zhang · 2026-06-01 04:00

从内部诊断到外部审计：一种由VLM驱动的无数据在线后门防御范式

arXiv:2601.19448v2 Announce Type: replace Abstract: Deep Neural Networks remain inherently vulnerable to backdoor attacks. Traditional test-time defenses largely operate under the paradigm of internal diagnosis methods like model repairing or input robustness, yet these approache…