English(EN) RADIO-ViPE: Online Tightly Coupled Multi-Modal Fusion for Open-Vocabulary Semantic SLAM in Dynamic Environments

RADIO-ViPE 使单目视频实现开放词汇语义SLAM

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-30 04:00

研究人员开发了RADIO-ViPE，一个新颖的语义SLAM系统，能够仅使用单目RGB视频在动态环境中进行开放词汇接地。该系统将基础模型的**多模态嵌入**与几何场景信息相结合，无需深度传感器或姿态初始化。RADIO-ViPE在TUM-RGBD基准测试中展现了最先进的性能，为机器人技术和无约束视频流提供了强大的语义接地能力。 AI

影响仅使用单目视频即可在动态环境中实现开放词汇语义接地，推动了机器人技术和视频分析的发展。

排序理由介绍一种新的语义SLAM系统的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Zaid Nasser, Mikhail Iumanov, Tianhao Li, Maxim Popov, Jaafar Mahmoud, Sergey Kolyubin · 2026-04-30 04:00

RADIO-ViPE：动态环境中开放词汇语义SLAM的在线紧耦合多模态融合

arXiv:2604.26067v1 Announce Type: new Abstract: We present RADIO-ViPE (Reduce All Domains Into One -- Video Pose Engine), an online semantic SLAM system that enables geometry-aware open-vocabulary grounding, associating arbitrary natural language queries with localized 3D regions…

报道来源 [1]

RADIO-ViPE：动态环境中开放词汇语义SLAM的在线紧耦合多模态融合

相关实体

相关话题