OpenAI 开发了新的机器人技术,使完全在模拟中训练的控制器能够在物理机器人上执行任务,即使在环境发生意外变化时也能如此。通过随机化模拟中的摩擦和传感器噪声等方面的因素,训练好的模型可以泛化到现实世界的动力学,而无需完美的复制品。这种方法包括使用 LSTM 和一种称为“事后经验回放”(Hindsight Experience Replay)的改进强化学习算法,使机器人能够适应并从二元奖励中学习,从而使其能够胜任更复杂的任务。 AI
排序理由 OpenAI 发表了一篇论文,详细介绍了在模拟中训练的新机器人技术。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →