PulseAugur
实时 16:54:26
实体 WA*

WA*

PulseAugur coverage of WA* — every cluster mentioning WA* across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_50645 ·

    新的WA*框架在AI规划中实现了零样本泛化

    研究人员开发了一个名为WA*的新型自改进规划框架,该框架将由关系图神经网络表示的价值启发式与Q学习相结合。这种方法指导搜索并利用结果数据来更新启发式,使其能够充当通用策略。该框架展示了强大的零样本泛化能力,无需搜索即可解决新的问题实例,这在稀疏奖励域中是传统深度强化学习方法的一项重大进步。该系统已在Sokoban、PushWorld、The Witness和2023年国际规划竞赛等基准测试中取得成功。