PulseAugur
实时 18:24:44

新的WA*框架在AI规划中实现了零样本泛化

研究人员开发了一个名为WA*的新型自改进规划框架,该框架将由关系图神经网络表示的价值启发式与Q学习相结合。这种方法指导搜索并利用结果数据来更新启发式,使其能够充当通用策略。该框架展示了强大的零样本泛化能力,无需搜索即可解决新的问题实例,这在稀疏奖励域中是传统深度强化学习方法的一项重大进步。该系统已在Sokoban、PushWorld、The Witness和2023年国际规划竞赛等基准测试中取得成功。 AI

影响 在规划任务中实现了强大的零样本泛化,有可能克服当前DRL方法的局限性。

排序理由 该集群包含一篇详细介绍新AI研究框架及其在基准测试中性能的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的WA*框架在AI规划中实现了零样本泛化

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Michael Aichm\"uller, Yannik Hesse, Hector Geffner ·

    Learning to Search and Searching to Learn for Generalization in Planning

    arXiv:2605.25720v1 Announce Type: new Abstract: Combinatorial generalization remains a central challenge in Deep Reinforcement Learning (DRL). Classical planning provides a simple yet challenging setting to study this problem through explicit relational descriptions, without requ…

  2. arXiv cs.AI TIER_1 English(EN) · Hector Geffner ·

    Learning to Search and Searching to Learn for Generalization in Planning

    Combinatorial generalization remains a central challenge in Deep Reinforcement Learning (DRL). Classical planning provides a simple yet challenging setting to study this problem through explicit relational descriptions, without requiring learning from perception. In sparse-reward…