新基准揭示多语言视觉-语言模型中的安全漏洞

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了MLingualFC，一个用于测试视觉-语言模型（VLMs）安全漏洞的新多语言基准。该基准使用以印地语、旁遮普语、西班牙语、罗马尼亚语和德语五种语言编码的有害指令的流程图图像。对Qwen2.5-VL、Gemma-4和Pangea等模型的评估显示，视觉攻击在拉丁字母语言中非常成功，表明当前的গুলিকে安全措施在跨语言和跨模态方面的泛化能力不佳。 AI

影响强调了在先进AI模型中需要更强大、多语言的安全对齐。

排序理由该集群包含一篇介绍用于评估AI模型安全性的新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Rishabh Makwana, Mamta, Deeksha Varshney, Oana Cocarascu · 2026-06-09 04:00

MLingualFC：评估多语言视觉-语言模型中的越狱漏洞

arXiv:2606.07706v1 Announce Type: cross Abstract: Vision-Language Models (VLMs) have demonstrated strong performance across multimodal tasks, yet their safety robustness remains an open challenge. While prior work has shown that structured visual prompts such as flowcharts can ef…

报道来源 [1]

MLingualFC：评估多语言视觉-语言模型中的越狱漏洞

相关实体

相关话题