PulseAugur
实时 14:19:08
English(EN) LangMap: A Human-Verified Benchmark for Hierarchical Open-Vocabulary Goal Navigation

新的LangMap基准通过人类验证的数据推动AI代理导航发展

研究人员推出LangMap,这是一个旨在评估AI代理层级开放词汇目标导航能力的新基准。该基准包含室内环境的人类验证语义标注,涵盖场景、房间、区域和实例级别的目标。LangMap旨在通过提供更准确、更详细的描述来解决现有基准的局限性,在文本到视图匹配方面优于以往的标注方法。一个名为PlaNaVid的基线模型使用RGB输入,在该基准上表现强劲,突出了记忆和上下文对导航任务的重要性。 AI

影响 增强了对AI代理在复杂、真实世界导航任务中的评估能力,推动了开放词汇目标设定的边界。

排序理由 该集群包含一篇介绍AI研究基准的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的LangMap基准通过人类验证的数据推动AI代理导航发展

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Bo Miao, Weijia Liu, Jun Luo, Lachlan Shinnick, Jian Liu, Thomas Hamilton-Smith, Yuhe Yang, Zijie Wu, Vanja Videnovic, Feras Dayoub, Anton van den Hengel ·

    LangMap: A Human-Verified Benchmark for Hierarchical Open-Vocabulary Goal Navigation

    arXiv:2602.02220v2 Announce Type: replace Abstract: Language-conditioned goal navigation (LGN) requires agents to locate user-specified targets without step-by-step guidance. However, existing benchmarks largely focus on category-level goals or rely on instance descriptions gener…