English(EN) Task diversity produces systematic transfer but inhibits continual reinforcement learning

新基准 Banyan 测试持续强化学习迁移和学习

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了 Banyan，这是一个利用 GPU 加速的持续强化学习新基准。该基准允许在导航、物体交互和分层子目标结构中对任务多样性进行受控操纵。虽然增加多样性可以提高智能体在不重新训练的情况下泛化到新任务的能力，但它并不固有地保证持续的持续学习，因为智能体可能仍然会忘记早期任务或在长视野目标上停滞不前。 AI

影响引入了一个评估持续强化学习智能体的新基准，可能指导未来在迁移学习和适应性方面的研究。

排序理由这是一篇描述持续强化学习新基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

arXiv

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Purab Seth, Neil Shah, Kunal Jha, Samuel J. Gershman, Max Kleiman-Weiner, Wilka Carvalho · 2026-06-02 04:00

Task diversity produces systematic transfer but inhibits continual reinforcement learning

arXiv:2606.00880v1 Announce Type: cross Abstract: Continual reinforcement learning aims to produce agents that learn not only to improve at their current tasks but also to adapt as task distributions change. Training an agent on many diverse tasks can induce zero-shot generalizat…

报道来源 [1]

Task diversity produces systematic transfer but inhibits continual reinforcement learning

相关实体

相关话题