研究人员开发了一个新的数据集MCV SafetyBench,用于测试多模态大语言模型(MLLM)对恶意输入的脆弱性。该数据集包含2,920个视频,揭示与静态图像相比,MLLM在面对多样化、动态的视频输入时更容易受到有害内容的攻击。该研究还强调,越狱攻击的成功率随着视频片段数量的增加而提高,并提出了利用图像模态鲁棒性作为防御策略。 AI
影响 凸显了视频处理AI潜在的安全风险,并提出了新的防御策略。
排序理由 该集群包含两篇讨论多模态大语言模型研究的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →