研究人员开发了 Phone2Act,一个新颖的远程操作系统,通过 Google ARCore 将标准智能手机用作 6-DoF 机器人控制器。这个低成本、硬件无关的框架旨在简化和扩展用于训练 Vision-Language-Action (VLA) 模型的操纵数据的收集。通过解耦控制逻辑并支持各种机器人平台,Phone2Act 使研究人员能够更经济地收集多样化的数据集,用于即时微调 GR00T-N1.5 等模型。 AI
影响 该系统可以显著降低 VLA 模型数据收集的成本并扩大其规模,从而可能加速其开发和部署。
排序理由 这是一篇关于用于 AI 模型数据收集的新系统的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →