中文(ZH) 1小时真机RL微调成功率破95%！HIL-ResRL：即插即用的VLA“外挂”神器

HIL-ResRL：AI机器人适配器1小时微调，成功率提升至95%

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-24 10:38

研究人员开发了HIL-ResRL，一种用于视觉-语言-动作（VLA）模型的新型适配器，能够对真实世界机器人任务进行快速、安全的微调。该系统使用轻量级的残差策略，并结合了人工干预（human-in-the-loop）来纠正错误，并将预训练的VLA模型适配到特定的工业环境中。在UR5e机器人手臂的测试中，HIL-ResRL在经过仅一小时的实时训练后，在抓取放置和插拔等任务上取得了超过95%的成功率，显著优于现有的强化学习基线，并通过最大限度地减少危险探索来提高安全性。 AI

影响通过将现有的VLA模型适配到真实世界任务，并进行最少量的训练，从而能够更快、更安全地将机器人部署到制造业中。

排序理由发布了一篇详细介绍用于机器人微调VLA模型的新颖方法的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

量子位 (QbitAI) TIER_1 中文(ZH) · 量子位的朋友们 · 2026-06-24 10:38

1 Hour Real Machine RL Fine-tuning Success Rate Exceeds 95%! HIL-ResRL: A Plug-and-Play VLA "External" Artifact

报道来源 [1]

1 Hour Real Machine RL Fine-tuning Success Rate Exceeds 95%! HIL-ResRL: A Plug-and-Play VLA "External" Artifact

相关实体

相关话题