研究人员推出了一种新颖的CoFL-S框架,旨在改进视觉语言导航(VLN)任务的低级动作生成。该方法在机器人的局部视图内预测一个语言条件流场,从而能够生成连续轨迹。通过将现有的VLN-CE片段转换为带有对齐子指令和动作目标的帧级监督,CoFL-S得到了训练。与在新的连续时间Habitat基准上的动作令牌和动作块基线相比,该框架表现出更优越的性能,并在实际部署中显示了有效性。 AI
影响 这项研究通过改进低级动作控制,可能带来更流畅、响应更快的机器人导航系统。
排序理由 该集群包含一篇详细介绍特定AI任务的新框架和基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →