PulseAugur
实时 09:16:28
English(EN) Predictive Statistics Shape Emergent World Representations of Grid Walkers

神经网络从预测统计中发展出世界模型

研究人员探讨了神经网络,特别是 Transformer 和循环网络,如何发展出世界动力学的内部表征。使用格子上约束随机行走的简化模型,他们观察到 Transformer 的第一个注意力块有效地提取了一个代表行走者状态和问题约束的“充分统计量”。随后的层将此状态转化为预测几何,揭示了一种可以被解释为世界模型的通用世界状态表征。 AI

影响 为了解神经网络如何内化数据结构提供了见解,可能为未来的模型架构提供信息。

排序理由 这是一篇详细介绍神经网络如何表征世界动力学研究结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Sasha Brenner, Thomas R. Kn\"osche, Nico Scherf ·

    预测性统计塑造网格行走者的涌现世界表征

    arXiv:2603.16689v2 Announce Type: replace Abstract: Next-token predictors often appear to develop internal representations of the latent world and its rules. The probabilistic nature of these models suggests a deep connection between the structure of the world and the geometry of…