English(EN) LangMap: A Human-Verified Benchmark for Hierarchical Open-Vocabulary Goal Navigation

新的LangMap基准通过人类验证的数据推动AI代理导航发展

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 04:00

研究人员推出LangMap，这是一个旨在评估AI代理层级开放词汇目标导航能力的新基准。该基准包含室内环境的人类验证语义标注，涵盖场景、房间、区域和实例级别的目标。LangMap旨在通过提供更准确、更详细的描述来解决现有基准的局限性，在文本到视图匹配方面优于以往的标注方法。一个名为PlaNaVid的基线模型使用RGB输入，在该基准上表现强劲，突出了记忆和上下文对导航任务的重要性。 AI

影响增强了对AI代理在复杂、真实世界导航任务中的评估能力，推动了开放词汇目标设定的边界。

排序理由该集群包含一篇介绍AI研究基准的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Bo Miao, Weijia Liu, Jun Luo, Lachlan Shinnick, Jian Liu, Thomas Hamilton-Smith, Yuhe Yang, Zijie Wu, Vanja Videnovic, Feras Dayoub, Anton van den Hengel · 2026-06-01 04:00

LangMap: A Human-Verified Benchmark for Hierarchical Open-Vocabulary Goal Navigation

arXiv:2602.02220v2 Announce Type: replace Abstract: Language-conditioned goal navigation (LGN) requires agents to locate user-specified targets without step-by-step guidance. However, existing benchmarks largely focus on category-level goals or rely on instance descriptions gener…

报道来源 [1]

LangMap: A Human-Verified Benchmark for Hierarchical Open-Vocabulary Goal Navigation

相关实体

相关话题