OpenAI发布了八个模拟机器人环境和Hindsight Experience Replay (HER)的实现,以推进机器人研究。这些为MuJoCo物理模拟器构建的新环境,比以往的基准测试具有更复杂的操纵任务,并利用稀疏奖励来模拟现实世界的机器人应用。同时发布的HER算法使强化学习代理能够从失败中学习,将已达到的状态视为目标,即使它们不是最初的目标。 AI
排序理由 主要AI实验室发布研究环境和算法实现。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →