研究人员开发了一种新方法来提高CLIP(一种用于零样本图像分类的模型)的可靠性。该技术解决了对抗性攻击不仅降低准确性,还会通过抑制不确定性导致模型过度自信的问题。通过将CLIP的输出视为Dirichlet分布的参数,该方法使模型的置信度与输入难度保持一致,从而恢复校准的不确定性,增强对抗鲁棒性,同时保持干净的准确性。 AI
影响 增强了视觉语言模型在对抗性操纵下的鲁棒性和可信度。
排序理由 详细介绍一种提高模型可靠性新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →