PulseAugur
实时 02:50:48
English(EN) From Internal Diagnosis to External Auditing: A VLM-Driven Paradigm for Data-Free Online Backdoor Defense

新的VLM驱动防御框架PRISM针对后门攻击

研究人员推出了一种新颖的框架PRISM,用于防御深度神经网络中的后门攻击。该方法将内部模型诊断转向外部语义审计,利用通用视觉语言模型(VLM)作为独立的安保审计员。PRISM在线优化视觉原型,并使用自适应路由器进行实时阈值校准,在抑制攻击成功率的同时保持干净准确率方面表现出最先进的性能。 AI

影响 引入了一种新颖的、外部化的后门攻击防御机制,可能增强已部署AI模型的安全性。

排序理由 该集群包含一篇详细介绍深度神经网络新防御机制的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Binyan Xu, Fan Yang, Xilin Dai, Di Tang, Kehuan Zhang ·

    从内部诊断到外部审计:一种由VLM驱动的无数据在线后门防御范式

    arXiv:2601.19448v2 Announce Type: replace Abstract: Deep Neural Networks remain inherently vulnerable to backdoor attacks. Traditional test-time defenses largely operate under the paradigm of internal diagnosis methods like model repairing or input robustness, yet these approache…