研究人员通过引入一个学习到的“rerooter”来解决复杂单智能体确定性问题中的策略树搜索问题,开发了一种新方法。该方法将问题隐式地分解为软子任务,避免了显式子目标生成的需求,并降低了计算开销。该论文提出了三种 rerooter 设计——基于聚类、基于启发式和混合式——它们利用了全局状态空间结构和学习到的到达目标成本估计。在实践中,这些 rerooting 方法在传统基于子目标的方法失败的复杂环境中表现出可扩展性,并实现了最先进的在线训练效率。 AI
影响 增强了复杂 AI 搜索问题的可扩展性,有可能提高游戏玩法和机器人等领域的性能。
排序理由 这是一篇详细介绍新算法方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →