实体 Vision And Language Navigation

Vision And Language Navigation

PulseAugur coverage of Vision And Language Navigation — every cluster mentioning Vision And Language Navigation across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_40934 · May 19 · 10:18

P2DNav框架增强零样本视觉语言导航

研究人员推出P2DNav，一个旨在提高具身智能体零样本视觉语言导航能力的新分层框架。该系统将导航分解为两个不同的阶段：从全景视图中选择方向，然后使用俯视图像在该方向内进行指令接地。P2DNav还包含一个滑动窗口对话记忆来管理导航历史，以及一个反思性重新定向机制来评估接地可靠性，从而增强在未知环境中的决策能力。
TOOL · CL_30550 · May 13 · 10:41

StereoNav框架提升AI代理的真实世界导航能力

研究人员推出了一种名为StereoNav的新框架，旨在提高视觉-语言导航（VLN）代理在真实环境中导航的可靠性。该系统通过引入目标位置先验以实现稳定引导，并利用立体视觉增强深度感知，来解决由感知不稳定和指令模糊引起的性能下降问题。实验表明，StereoNav在基准数据集上取得了最先进的成果，并在复杂、非结构化环境中展现出更强的导航可靠性，性能优于更大、数据密集型的模型。

P2DNav框架增强零样本视觉语言导航

StereoNav框架提升AI代理的真实世界导航能力