研究人员开发了创建3D场景图的新方法,这对于机器人导航和理解至关重要。LEXI-SG是一个新颖的系统,仅使用RGB摄像头输入即可实现密集的单目视觉映射,将场景划分为房间以进行可扩展的重建。另外,OpenSGA提供了一个高效的框架来对齐3D场景图,融合视觉-语言、文本和几何特征以建立对象对应关系。这两种方法都旨在提高机器人的记忆和环境交互能力。 AI
影响 3D场景图表示和对齐方面的进步可以增强机器人的感知和长期记忆能力。
排序理由 两篇研究论文介绍了3D场景图映射和对齐的新方法。
- GPT-4o
- OpenSGA
- ScanNet-SG
- 3D scene graphs
- Habitat-Matterport 3D
- LEXI-SG
- RGB camera
- robot navigation
- ScanNet
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →