研究人员推出 RLDX-1,这是一种用于灵巧操作的新型机器人策略,通过多流动作 Transformer 架构整合异构模态。该方法旨在通过整合运动感知、基于记忆的决策和物理传感来克服当前视觉-语言-动作模型的局限性。RLDX-1 在复杂现实世界任务和人形机器人控制方面,表现优于 $\pi_{0.5}$ 和 GR00T N1.6 等现有模型。 AI
影响 引入了一种新颖的灵巧机器人操作架构,可能在现实世界的人机交互方面提升能力。
排序理由 这是一份在 arXiv 上发布的关于新机器人策略和架构的技术报告。[lever_c_demoted from research: ic=1 ai=1.0]
- ALLEX
- GR00T N1.6
- MSAT
- Multi-Stream Action Transformer
- $\pi_{0.5}$
- RLDX-1
- Vision-Language-Action models
- VLAs
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →