研究人员开发了一种名为集群隔离隐藏(CSC)的新型防御机制,以对抗深度神经网络中的后门攻击。这些攻击在训练数据中嵌入恶意触发器,导致模型在特定输入上出现错误分类,同时在干净数据上表现正常。CSC通过在训练早期在潜在空间中对中毒样本进行聚类来识别它们,然后将这些样本重新标记为虚拟类别,从而有效地将后门关联替换为良性链接。评估表明,CSC的性能显著优于现有防御方法,将攻击成功率降至接近零,同时对干净数据的准确性影响最小。 AI
影响 引入了一种针对数据中毒攻击的新型防御方法,增强了深度学习模型的可靠性。
排序理由 详细介绍深度神经网络后门攻击新防御机制的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →