研究人员开发了PROSE,一种无需训练或深度传感器即可注册自中心RGB序列的新颖方法。PROSE利用预训练的视觉语言模型创建对象级别的3D场景图,并在不同捕获之间匹配对象实例。与现有的几何和学习场景图方法相比,该方法在Aria数字孪生和Aria日常活动基准测试中表现出优越的性能。 AI
影响 通过改进自中心场景注册,该方法可以为机器人和AR系统实现更强大的空间记忆。
排序理由 该集群包含一篇研究论文,详细介绍了一种使用视觉语言模型进行场景注册的新方法。
- alphaXiv
- Aria Digital Twin
- Aria Everyday Activities
- arXiv
- CatalyzeX
- Connected Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- Hugging Face
- Influence Flower
- Litmaps
- PROSE
- ScienceCast
- scite Smart Citations
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →