PulseAugur
实时 12:08:07

新方法增强CLIP对抗对抗性攻击的能力

研究人员开发了一种新方法来提高CLIP(一种用于零样本图像分类的模型)的可靠性。该技术解决了对抗性攻击不仅降低准确性,还会通过抑制不确定性导致模型过度自信的问题。通过将CLIP的输出视为Dirichlet分布的参数,该方法使模型的置信度与输入难度保持一致,从而恢复校准的不确定性,增强对抗鲁棒性,同时保持干净的准确性。 AI

影响 增强了视觉语言模型在对抗性操纵下的鲁棒性和可信度。

排序理由 详细介绍一种提高模型可靠性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Wenjing Lu, Zerui Tao, Yuning Qiu, Dongping Zhang, Yang Yang, Qibin Zhao ·

    Calibrating Uncertainty for Zero-Shot Adversarial CLIP

    arXiv:2512.12997v2 Announce Type: replace-cross Abstract: CLIP delivers strong zero-shot classification but remains highly vulnerable to adversarial attacks. Prior adversarial fine-tuning work primarily matches predicted logits between clean and adversarial examples, which overlo…