研究人员开发了一种在强化学习中进行无监督技能发现和分层结构学习的新方法。该方法使用基于语法的技术,将未标记的轨迹分割成技能,并将它们组织成一个层次结构。该方法已在 Craftax 和 Minecraft 等复杂环境中进行了评估,证明其能够创建比现有方法更有意义的层次结构,并加速下游学习任务。 AI
排序理由 这是一篇详细介绍强化学习中技能发现新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →