研究人员开发了一种新的Transformer分类器符号执行测试方法,该方法使用SHAP估计来根据路径谓词对模型预测的影响来确定其优先级。这种方法使用Python实现,使自注意力语义与可满足性模理论求解器兼容。在CIFAR-10上对紧凑型Transformer模型、ResNet18和VGG16进行的评估表明,在单像素预算和900秒的时间范围内,找到对抗性样本的成功率为60%,显著优于黑盒差分进化基线。 AI
影响 增强了寻找Transformer模型中对抗性样本的实用方法,改进了AI安全研究。
排序理由 该集群包含一篇研究论文,详细介绍了一种测试神经网络鲁棒性的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- Chih-Duo Hong
- CIFAR-10
- Hugging Face
- Python
- ResNet18
- satisfiability modulo theories
- Shap
- transformer
- Vgg16
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →