一篇新研究论文引入了“对齐诅咒”原则,该原则证明了全模态模型中改进的文本-音频模态对齐如何会无意中将安全漏洞从文本迁移到音频。研究人员发现,文本迁移的音频攻击与仅音频攻击一样有效,甚至常常更优越,这表明当前的音频安全评估可能低估了风险。该研究分析了Qwen2.5-Omni和Qwen3-Omni等模型,发现更紧密的模态对齐与更有效的跨模态攻击迁移之间存在持续的相关性。 AI
影响 突显了人工智能能力与安全之间的根本性矛盾,表明当前的音频安全措施可能不足。
排序理由 介绍新原则和经验性发现的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →