研究人员开发了一个名为 Stubborn 的新强化学习框架,旨在提高人形机器人的运动跟踪和跌倒恢复能力。与之前将这些视为需要复杂多阶段训练的独立任务的方法不同,Stubborn 将它们统一到一个框架中。它包含一种新颖的概率终止机制,以鼓励探索恢复行为,以及一种自适应采样策略,该策略将训练重点放在困难的运动片段和不稳定的状态上,从而带来更鲁棒的性能。 AI
影响 引入了一种统一的人形机器人运动和跌倒恢复方法,有可能提高机器人在现实场景中的稳定性和适应性。
排序理由 这是一篇详细介绍机器人强化学习新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →