PulseAugur
实时 01:22:45
English(EN) REALM: A Unified Red-Teaming Benchmark for Physical-World VLMs

新的REALM基准统一了物理世界视觉语言模型的红队测试

研究人员推出了REALM,这是一个旨在评估物理世界视觉语言模型(VLMs)漏洞的新型基准。该基准在黑盒威胁模型下统一了12种红队测试方法、3种防御措施和13个VLMs,并利用共享数据集和指标进行公平比较。REALM采用代理目标生成流程来创建场景特定的、物理上可行的攻击目标,结果表明文本和字体注入攻击最有效,而模型规模本身并不能保证对抗鲁棒性。 AI

影响 为评估VLMs在物理世界应用中的安全性和鲁棒性建立了一种标准化方法。

排序理由 该项目是一篇介绍新基准以评估AI模型的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的REALM基准统一了物理世界视觉语言模型的红队测试

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Yifei Zhao, Qian Lou, Mengxin Zheng ·

    REALM:面向物理世界视觉语言模型的统一红队测试基准

    arXiv:2606.23892v1 Announce Type: new Abstract: Vision-language models (VLMs) are increasingly used as perception-reasoning backbones for embodied intelligence in safety-critical physical systems, where perception or reasoning errors can lead to unsafe decisions or actions. Altho…