研究人员开发了针对先进AI模型的新型后门攻击方法,特别针对视觉语言模型(VLMs)和扩散模型(DMs)。一种方法CBV利用扩散模型通过微妙地改变图像生成过程并在语义重要区域集中修改,为VLMs创建外观自然的受污染样本。另一种方法Gungnir利用图像内的风格特征作为扩散模型的隐蔽触发器,使攻击更难被检测和绕过现有防御。 AI
影响 新的攻击向量凸显了VLMs和扩散模型的漏洞,有必要在AI安全和防御机制方面取得进展。
排序理由 两篇研究论文详细介绍了针对AI模型的新型后门攻击方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →