English(EN) RoboStressBench: Benchmarking VLM Robustness to Physical Visual Stress in Embodied Scenes

新基准测试 VLM 对物理视觉压力的鲁棒性

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-30 00:00

研究人员推出了 RoboStressBench，这是一个旨在评估具身 AI 系统中视觉-语言模型 (VLM) 鲁棒性的新基准。该基准将视觉压力分解为四个关键物理维度：材质、视角、光照和几何。通过在这些不同条件下评估 VLM，RoboStressBench 旨在识别特定的故障模式并提高 AI 在现实世界场景中的感知可靠性。 AI

影响为评估和提高 VLM 在物理环境中的可靠性提供了一个框架，这对于具身 AI 应用至关重要。

排序理由该集群描述了一篇介绍用于评估 AI 模型的新基准的学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

Hugging Face Daily Papers TIER_1 English(EN) · 2026-05-30 00:00

RoboStressBench：在具身场景中对实体视觉压力的VLM鲁棒性进行基准测试

RoboStressBench presents a principled benchmark for evaluating vision-language model robustness to physical visual stress in embodied AI, decomposing visual stress into material, viewpoint, lighting, and geometry dimensions.
arXiv cs.CV TIER_1 English(EN) · Leyi Wu, Yifan Zhao, Jinjie Zhang, Suzeyu Chen, Wosong Chen, Zhifei Chen, Tianshuo Xu, Qingchun He, Hongxin Hu, Haojian Huang, Yangkai Wei, Wenqian Li, Yinchuan Li, Ying-Cong Chen · 2026-06-02 04:00

RoboStressBench：在具身场景中对实体视觉压力的 VLM 鲁棒性进行基准测试

arXiv:2606.00828v1 Announce Type: new Abstract: Vision-Language Models (VLMs) have shown strong visual understanding and are increasingly deployed in embodied AI systems, where reliable perception under real conditions is essential. However, existing benchmarks assess VLMs using …

报道来源 [2]

RoboStressBench：在具身场景中对实体视觉压力的VLM鲁棒性进行基准测试

RoboStressBench：在具身场景中对实体视觉压力的 VLM 鲁棒性进行基准测试

相关实体

相关话题