研究人员在针对AI模型的迁移攻击中发现了一种称为“剪刀效应”的现象。该效应表明,虽然随机调整大小和填充(输入多样性或DI)通常能提高标准模型的攻击成功率,但它们会严重阻碍对鲁棒训练模型的攻击。这一反直觉的发现是在CNN、ViT和Swin Transformer等各种模型架构以及ImageNet和CIFAR-10等数据集上观察到的,表明DI的有效性高度依赖于模型的训练机制。研究将这种效应归因于梯度的几何特性,其中调整大小被认为是导致鲁棒模型性能下降的主要因素。提出了一种名为CG-DI的新规则,在梯度一致性表明可能有害时选择性地禁用多样性措施,从而在标准模型上保留攻击优势,同时减轻鲁棒模型上的损失。 AI
影响 揭示了对抗性攻击策略中的关键权衡,影响模型鲁棒性评估和防御。
排序理由 学术论文,详细介绍了AI模型攻击中的一种新现象。[lever_c_demoted from research: ic=1 ai=1.0]
- CIFAR-10
- CNN
- ConvNeXt
- ImageNet
- Input Diversity (DI)
- Local Gradient Consistency (LGC)
- Scissors Effect
- Swin Transformer
- Vít
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →