English(EN) Pondering the Way: Spatial-perceiving World Action Model for Embodied Navigation

新的SWAM模型支持单通道RGB输入实现高效具身导航

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了SWAM（空间感知世界动作模型），一个新颖的具身导航框架，它在单次通过中联合生成中间视觉序列和动作轨迹。与以前以验证为中心的方法不同，SWAM直接从起始和目标RGB观测合成与目标一致的路径，提高了空间可行性和效率。尽管使用深度伪标签进行训练，但该模型在推理时仅需要单目RGB输入，并在各种实验中展示了优于最先进规划器的性能。 AI

影响这个新模型可以显著提高机器人在真实环境中执行导航任务的效率和准确性。

排序理由关于具身导航新模型的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Hong Chen, Daqi Liu, Zehan Zhang, Haiguang Wang, Tianhao Lu, Longfei Yan, Haiyang Sun, Fangzhen Li, Hongwei Xie, Bing Wang, Guang Chen, Hangjun Ye, Yihua Tan · 2026-06-30 04:00

思考之道：用于具身导航的空间感知世界动作模型

arXiv:2606.29908v1 Announce Type: cross Abstract: Existing world model-based planners for visual navigation typically follow a verification-centric paradigm, decoupling goal intent from trajectory synthesis. This approach suffers from candidate dependence, heavy computational ove…

报道来源 [1]

思考之道：用于具身导航的空间感知世界动作模型

相关实体

相关话题