English(EN) Exploiting Local Dynamics Regularity for Reusable Skills in Offline Hierarchical RL

新算法CARL增强分层强化学习中的技能可复用性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 04:00

研究人员开发了一种名为CARL（对比动作表示用于可复用局部控制）的新算法，以提高分层强化学习（HRL）中技能的可复用性。CARL利用局部动力学的规律性，表明在不同的全局环境中，相似的动作序列对于状态转移是必需的。通过将这些环境与其所需的动作序列对齐，该算法学习在哪里以及复用哪些技能，可能使各种HRL算法受益。该方法在复杂环境中展示了定性的技能聚类，并在与HIQL集成后，在OGBench基准测试中提高了性能。 AI

排序理由这是一篇研究论文，详细介绍了一个特定AI领域的新算法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Sarthak Dayal, Abhinav Peri, Carl Qi, Claas Voelcker, Alexander Levine, Caleb Chuck, Amy Zhang · 2026-05-27 04:00

利用局部动力学规律实现离线分层强化学习中的可复用技能

arXiv:2605.26371v1 Announce Type: new Abstract: Hierarchical Reinforcement Learning (HRL) promises to solve long-horizon Reinforcement Learning (RL) tasks more efficiently than non-hierarchical counterparts by discovering and reusing temporally-extended skills. However, obtaining…

报道来源 [1]

利用局部动力学规律实现离线分层强化学习中的可复用技能

相关实体

相关话题