研究人员部分逆向工程了用于 Sokoban 游戏的卷积循环神经网络 (RNN)。他们发现该网络将其未来移动或规划存储在其隐藏状态内的特定“路径通道”的激活中。这些通道受到编码学习到的转换模型的卷积核的影响,使 RNN 能够通过将激活从箱子传播到目标来构建规划,并使用负值在障碍物处修剪路径,从而有效地实现一种回溯形式。 AI
排序理由 该集群包含一篇学术论文,详细介绍了训练神经网络中规划的新机制描述。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →