English(EN) Unambiguous Representations in Neural Networks: An Information-Theoretic Approach to Intentionality

新框架衡量神经网络中的表征歧义

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一个新的信息论框架来衡量神经网络中的表征歧义。他们在 MNIST 分类器上的实验表明，即使行为准确性与标准网络相同，网络连接中的关系结构也可以无歧义地编码内容。这项工作提供了一种量化评估表征歧义的方法，并表明神经网络可以表现出被理论化为对意识至关重要的低歧义表征。 AI

影响引入了一种理解神经网络中表征的新量化方法，可能影响人工智能安全和可解释性研究。

排序理由这是一篇发表在 arXiv 上的研究论文，详细介绍了新的理论框架和实验结果。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Francesco L\"assig · 2026-06-09 04:00

神经网络中的无歧义表征：一种关于意向性的信息论方法

arXiv:2512.11000v2 Announce Type: replace-cross Abstract: Representations pervade our daily experience, from letters representing sounds to bit strings encoding digital files. While such representations require externally defined decoders to convey meaning, conscious experience i…