研究人员开发了HIL-ResRL,一种用于视觉-语言-动作(VLA)模型的新型适配器,能够对真实世界机器人任务进行快速、安全的微调。该系统使用轻量级的残差策略,并结合了人工干预(human-in-the-loop)来纠正错误,并将预训练的VLA模型适配到特定的工业环境中。在UR5e机器人手臂的测试中,HIL-ResRL在经过仅一小时的实时训练后,在抓取放置和插拔等任务上取得了超过95%的成功率,显著优于现有的强化学习基线,并通过最大限度地减少危险探索来提高安全性。 AI
影响 通过将现有的VLA模型适配到真实世界任务,并进行最少量的训练,从而能够更快、更安全地将机器人部署到制造业中。
排序理由 发布了一篇详细介绍用于机器人微调VLA模型的新颖方法的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →