研究人员开发了$\mu_0$,一种新颖的机器人世界模型,它利用3D交互轨迹来预测显著物体和点的运动。这种方法绕过了对特定于具身行为的动作标签的需求,从而实现了更具可扩展性的机器人学习。该系统借助TraceExtract工具自动提取3D监督信息,并使用模块化轨迹专家预训练视觉语言骨干网络。实验表明,$\mu_0$的表现优于现有的轨迹预测模型和标记化VLM方法,确立了3D轨迹作为可转移的操纵任务表示。 AI
影响 确立了3D轨迹作为机器人跨具身操纵的可扩展且可转移的表示。
排序理由 发布了一篇详细介绍新AI模型和方法的学术论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →