PulseAugur
实时 04:49:10
English(EN) Exploiting Local Dynamics Regularity for Reusable Skills in Offline Hierarchical RL

新算法CARL增强分层强化学习中的技能可复用性

研究人员开发了一种名为CARL(对比动作表示用于可复用局部控制)的新算法,以提高分层强化学习(HRL)中技能的可复用性。CARL利用局部动力学的规律性,表明在不同的全局环境中,相似的动作序列对于状态转移是必需的。通过将这些环境与其所需的动作序列对齐,该算法学习在哪里以及复用哪些技能,可能使各种HRL算法受益。该方法在复杂环境中展示了定性的技能聚类,并在与HIQL集成后,在OGBench基准测试中提高了性能。 AI

排序理由 这是一篇研究论文,详细介绍了一个特定AI领域的新算法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新算法CARL增强分层强化学习中的技能可复用性

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Sarthak Dayal, Abhinav Peri, Carl Qi, Claas Voelcker, Alexander Levine, Caleb Chuck, Amy Zhang ·

    利用局部动力学规律实现离线分层强化学习中的可复用技能

    arXiv:2605.26371v1 Announce Type: new Abstract: Hierarchical Reinforcement Learning (HRL) promises to solve long-horizon Reinforcement Learning (RL) tasks more efficiently than non-hierarchical counterparts by discovering and reusing temporally-extended skills. However, obtaining…