研究人员推出了REALM,这是一个旨在评估物理世界视觉语言模型(VLMs)漏洞的新型基准。该基准在黑盒威胁模型下统一了12种红队测试方法、3种防御措施和13个VLMs,并利用共享数据集和指标进行公平比较。REALM采用代理目标生成流程来创建场景特定的、物理上可行的攻击目标,结果表明文本和字体注入攻击最有效,而模型规模本身并不能保证对抗鲁棒性。 AI
影响 为评估VLMs在物理世界应用中的安全性和鲁棒性建立了一种标准化方法。
排序理由 该项目是一篇介绍新基准以评估AI模型的论文。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- arXiv
- CatalyzeX
- Connected Papers
- DagsHub
- Gotit.pub
- Hugging Face
- Influence Flower
- Litmaps
- REALM
- ScienceCast
- scite Smart Citations
- Vision--Language Models
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →