研究人员开发了MLingualFC,一个用于测试视觉-语言模型(VLMs)安全漏洞的新多语言基准。该基准使用以印地语、旁遮普语、西班牙语、罗马尼亚语和德语五种语言编码的有害指令的流程图图像。对Qwen2.5-VL、Gemma-4和Pangea等模型的评估显示,视觉攻击在拉丁字母语言中非常成功,表明当前的গুলিকে安全措施在跨语言和跨模态方面的泛化能力不佳。 AI
影响 强调了在先进AI模型中需要更强大、多语言的安全对齐。
排序理由 该集群包含一篇介绍用于评估AI模型安全性的新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →