English(EN) Mind Dreamer: Untethering Imagination via Active Latent Intervention on Latent Manifolds

Mind Dreamer 框架通过主动想象增强强化学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-15 15:05

研究人员推出了一种名为 Mind Dreamer (MD) 的新颖框架，旨在通过使想象力超越观察到的状态来增强基于模型的强化学习。MD 采用主动潜在干预 (ALI) 来合成合理但具有挑战性的初始状态，超越了历史束缚。该方法利用学习到的生成器和对抗过程来探索认知盲点，并推导出了中继价值函数 (RVF) 和中继不确定性函数 (RUF) 来处理这些合成状态的信用分配。经验表明，MD 在现有方法上实现了显著的加速，平均学习速度提高了 1.67 倍，在稀疏奖励任务上达到了 8.8 倍。 AI

影响通过实现更动态的智能体想象，引入了一种提高强化学习样本效率和探索能力的新方法。

排序理由该集群包含一篇新发表的学术论文，详细介绍了新颖的框架及其经验结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Rong Zhao · 2026-05-15 15:05

Mind Dreamer：通过对潜在流形进行主动潜在干预来释放想象力

Model-Based Reinforcement Learning (MBRL) leverages latent imagination for sample efficiency, yet remains constrained by Historical Tethering: imagination is typically initialized from observed states. This creates a learning asymmetry, where the world model's manifold discovery …

报道来源 [1]

Mind Dreamer：通过对潜在流形进行主动潜在干预来释放想象力

相关实体

相关话题