研究人员开发了一个名为 Infoprop Dyna 的新强化学习框架,允许机器人在现实世界交互中直接学习复杂任务,无需传统的基于物理的模拟器。该方法使 Mini Wheelbot(一种欠驱动的独轮机器人)在仅 11 分钟的实际运行时间内学会了在赛道上比赛。该方法对于具有快速、不稳定动力学的机器人特别有效,能将它们推向性能极限。 AI
影响 展示了一种更快速、无需模拟器的机器人学习方法,有望加速现实世界中的机器人应用。
排序理由 这是一篇详细介绍新强化学习框架及其在机器人平台应用的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →