来自浙江大学、香港中文大学和浙江大学的研究人员开发了一个名为 RAM 的新模型,用于机器人中的 3D 空间理解和操作。该模型通过创建一个外部 3D 知识库,解决了当前视觉语言模型的局限性,从而能够更好地理解物体姿态和进行远程任务规划。实际测试表明,该模型在语言驱动和图像引导的操作方面均取得了高成功率,并且 RAM 与各种大型模型和机器人平台兼容。 AI
影响 为机器人引入了一种新颖的 3D 空间理解方法,有可能提高它们根据自然语言或视觉线索执行复杂任务的能力。
排序理由 学术论文发表在顶级期刊上,详细介绍了一个新的机器人模型。
- AMD
- GPT
- Lisa Su
- MI450
- Qwen-VL
- RAM
- Science Robotics
- Chinese University of Hong Kong
- Zhejiang University
- Helios
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →