English(EN) REALM: A Unified Red-Teaming Benchmark for Physical-World VLMs

新的REALM基准统一了物理世界视觉语言模型的红队测试

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:00

研究人员推出了REALM，这是一个旨在评估物理世界视觉语言模型（VLMs）漏洞的新型基准。该基准在黑盒威胁模型下统一了12种红队测试方法、3种防御措施和13个VLMs，并利用共享数据集和指标进行公平比较。REALM采用代理目标生成流程来创建场景特定的、物理上可行的攻击目标，结果表明文本和字体注入攻击最有效，而模型规模本身并不能保证对抗鲁棒性。 AI

影响为评估VLMs在物理世界应用中的安全性和鲁棒性建立了一种标准化方法。

排序理由该项目是一篇介绍新基准以评估AI模型的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Yifei Zhao, Qian Lou, Mengxin Zheng · 2026-06-24 04:00

REALM：面向物理世界视觉语言模型的统一红队测试基准

arXiv:2606.23892v1 Announce Type: new Abstract: Vision-language models (VLMs) are increasingly used as perception-reasoning backbones for embodied intelligence in safety-critical physical systems, where perception or reasoning errors can lead to unsafe decisions or actions. Altho…

报道来源 [1]

REALM：面向物理世界视觉语言模型的统一红队测试基准

相关实体

相关话题