PulseAugur
实时 14:45:42
English(EN) RoboStressBench: Benchmarking VLM Robustness to Physical Visual Stress in Embodied Scenes

新基准测试 VLM 对物理视觉压力的鲁棒性

研究人员推出了 RoboStressBench,这是一个旨在评估具身 AI 系统中视觉-语言模型 (VLM) 鲁棒性的新基准。该基准将视觉压力分解为四个关键物理维度:材质、视角、光照和几何。通过在这些不同条件下评估 VLM,RoboStressBench 旨在识别特定的故障模式并提高 AI 在现实世界场景中的感知可靠性。 AI

影响 为评估和提高 VLM 在物理环境中的可靠性提供了一个框架,这对于具身 AI 应用至关重要。

排序理由 该集群描述了一篇介绍用于评估 AI 模型的新基准的学术论文。

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. Hugging Face Daily Papers TIER_1 English(EN) ·

    RoboStressBench:在具身场景中对实体视觉压力的VLM鲁棒性进行基准测试

    RoboStressBench presents a principled benchmark for evaluating vision-language model robustness to physical visual stress in embodied AI, decomposing visual stress into material, viewpoint, lighting, and geometry dimensions.

  2. arXiv cs.CV TIER_1 English(EN) · Leyi Wu, Yifan Zhao, Jinjie Zhang, Suzeyu Chen, Wosong Chen, Zhifei Chen, Tianshuo Xu, Qingchun He, Hongxin Hu, Haojian Huang, Yangkai Wei, Wenqian Li, Yinchuan Li, Ying-Cong Chen ·

    RoboStressBench:在具身场景中对实体视觉压力的 VLM 鲁棒性进行基准测试

    arXiv:2606.00828v1 Announce Type: new Abstract: Vision-Language Models (VLMs) have shown strong visual understanding and are increasingly deployed in embodied AI systems, where reliable perception under real conditions is essential. However, existing benchmarks assess VLMs using …