English(EN) MapReason-OSM: Can Vision-Language Models Make Graph-Verifiable Mobility Decisions from Street Maps ?

新基准测试 VLMs 在可验证的地图出行决策能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 04:00

研究人员推出了 MapReason-OSM，这是一个旨在评估视觉语言模型 (VLMs) 从街道地图中做出可验证出行决策能力的新基准。该基准涵盖美国十个城市的 6,000 多个实例，涉及路线规划、设施选址和视觉消歧等任务。目前的 VLMs 在基本地图阅读和路线规划方面表现出熟练度，但在成本分析（如设施选址）和跨不同地图比例尺保持一致性等复杂推理方面存在困难。 AI

影响该基准旨在通过关注可验证的决策来提高 VLMs 在物流和导航等现实场景中的实际应用。

排序理由该集群描述了一篇介绍 AI 模型评估基准的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Srinivas Venkatanarayanan, Clement Pakkam Isaac · 2026-06-24 04:00

MapReason-OSM: Can Vision-Language Models Make Graph-Verifiable Mobility Decisions from Street Maps ?

arXiv:2606.22597v2 Announce Type: replace Abstract: Vision-language models (VLMs) are increasingly used to read maps for logistics, delivery, and accessible navigation, where the output is an actionable decision (a route, a pin, a parking choice) that must respect the road networ…

报道来源 [1]

MapReason-OSM: Can Vision-Language Models Make Graph-Verifiable Mobility Decisions from Street Maps ?

相关实体

相关话题