研究人员开发了一种名为SILENTDRIFT的新型后门攻击,该攻击针对机器人中使用的视觉-语言-动作(VLA)模型。该攻击利用了这些模型处理动作序列的漏洞,允许细微的扰动累积并导致执行不正确。SILENTDRIFT在中毒量极少的情况下实现了高成功率,并在干净任务上保持了高性能,使得中毒轨迹在视觉上与正常操作无法区分。 AI
影响 凸显了已部署AI系统的关键安全漏洞,对安全关键型应用提出了稳健防御的必要性。
排序理由 该集群包含一篇详细介绍AI模型新型攻击方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →