新方法增强CLIP对抗对抗性攻击的能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了一种新方法来提高CLIP（一种用于零样本图像分类的模型）的可靠性。该技术解决了对抗性攻击不仅降低准确性，还会通过抑制不确定性导致模型过度自信的问题。通过将CLIP的输出视为Dirichlet分布的参数，该方法使模型的置信度与输入难度保持一致，从而恢复校准的不确定性，增强对抗鲁棒性，同时保持干净的准确性。 AI

影响增强了视觉语言模型在对抗性操纵下的鲁棒性和可信度。

排序理由详细介绍一种提高模型可靠性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

Wenjing Lu

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Wenjing Lu, Zerui Tao, Yuning Qiu, Dongping Zhang, Yang Yang, Qibin Zhao · 2026-06-02 04:00

Calibrating Uncertainty for Zero-Shot Adversarial CLIP

arXiv:2512.12997v2 Announce Type: replace-cross Abstract: CLIP delivers strong zero-shot classification but remains highly vulnerable to adversarial attacks. Prior adversarial fine-tuning work primarily matches predicted logits between clean and adversarial examples, which overlo…

报道来源 [1]

Calibrating Uncertainty for Zero-Shot Adversarial CLIP

相关实体

相关话题