研究人员推出了一种新颖的防御框架VPA-Guard,旨在保护图像到视频(I2V)生成模型免受视觉提示攻击。这些攻击利用箭头或草图等视觉线索来操纵模型生成有害内容。为解决此问题,该团队还开发了VVA-Bench,这是第一个专门用于评估I2V针对此类攻击安全性的基准。在VVA-Bench上的实验表明,当前最先进的模型极易受到攻击,在某些模型上的成功率高达100%。VPA-Guard利用检索增强和自我演化能力,显著降低了攻击成功率和有害性得分,同时保持了模型的效用。 AI
影响 增强了AI视频生成的安全协议,可能有助于更负责任地部署多模态AI系统。
排序理由 该集群包含一篇研究论文,详细介绍了新的AI模型安全防御机制和基准。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →