PulseAugur
实时 00:13:59
English(EN) Mind Dreamer: Untethering Imagination via Active Latent Intervention on Latent Manifolds

Mind Dreamer 框架通过主动想象增强强化学习

研究人员推出了一种名为 Mind Dreamer (MD) 的新颖框架,旨在通过使想象力超越观察到的状态来增强基于模型的强化学习。MD 采用主动潜在干预 (ALI) 来合成合理但具有挑战性的初始状态,超越了历史束缚。该方法利用学习到的生成器和对抗过程来探索认知盲点,并推导出了中继价值函数 (RVF) 和中继不确定性函数 (RUF) 来处理这些合成状态的信用分配。经验表明,MD 在现有方法上实现了显著的加速,平均学习速度提高了 1.67 倍,在稀疏奖励任务上达到了 8.8 倍。 AI

影响 通过实现更动态的智能体想象,引入了一种提高强化学习样本效率和探索能力的新方法。

排序理由 该集群包含一篇新发表的学术论文,详细介绍了新颖的框架及其经验结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Mind Dreamer 框架通过主动想象增强强化学习

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Rong Zhao ·

    Mind Dreamer:通过对潜在流形进行主动潜在干预来释放想象力

    Model-Based Reinforcement Learning (MBRL) leverages latent imagination for sample efficiency, yet remains constrained by Historical Tethering: imagination is typically initialized from observed states. This creates a learning asymmetry, where the world model's manifold discovery …