PulseAugur
实时 12:45:53
English(EN) PIGEON: VLM-Driven Object Navigation via Points of Interest Selection

PIGEON框架利用VLM实现高效对象导航

研究人员开发了PIGEON,一个用于在未见过室内环境中进行对象导航的新框架。PIGEON通过将导航构建为一个稀疏决策问题来利用视觉语言模型(VLMs),使用“兴趣点”(PoIs)将可执行的航点与视觉观测相结合。这种方法使VLMs能够选择关键的PoIs,例如探索前沿或目标对象,而低级规划器则处理连续运动。在Habitat ObjectNav基准上的实验表明,PIGEON在零样本性能上达到了最先进水平,并在物理机器人上表现出鲁棒性。 AI

影响 该框架可以提高机器人在复杂、未见环境中的导航效率和适应性。

排序理由 该集群包含一篇详细介绍新的对象导航框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Cheng Peng, Zhenzhe Zhang, Xiaobao Wei, Yanhao Zhang, Heng Wang, Pengwei Wang, Zhongyuan Wang, Cheng Chi, Shanghang Zhang, Jing Liu ·

    PIGEON: VLM-Driven Object Navigation via Points of Interest Selection

    arXiv:2511.13207v2 Announce Type: replace-cross Abstract: Object navigation in unseen indoor environments requires agents to perform semantic search under partial observability. Vision-language models (VLMs) provide strong semantic-spatial priors for this task, but how to interfa…