English(EN) What to Test Next: Interpretable Coverage Gap Discovery in Driving VLMs

新的LLM管道增强了驾驶视觉语言模型的测试

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了SliceNav，这是一个由LLM编排的管道，旨在改进驾驶视觉语言模型（VLM）的测试。该系统通过推荐操作设计域（ODD）内的测试不足区域来解决验证稀疏性的挑战。SliceNav利用评分规则，优先考虑罕见条件，并从类似的测试场景中传播风险，确保了确定性和可审计的验证过程。 AI

影响这项研究提供了一种系统性地识别和解决驾驶视觉语言模型弱点的新方法，有望带来更安全的自动驾驶系统。

排序理由该集群包含一篇详细介绍AI模型测试新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Abhishek Aich, Sparsh Garg, Vijay Kumar BG, Turgun Yusuf Kashgari, Manmohan Chandraker · 2026-06-02 04:00

What to Test Next: Interpretable Coverage Gap Discovery in Driving VLMs

arXiv:2606.01624v1 Announce Type: new Abstract: Driving vision-language models (VLMs) must accurately understand scenes across diverse conditions defined by Operational Design Domains (ODDs), yet verification remains sparse: many slices are missing, making empirical failure rates…