English(EN) What Makes Effective Supervision in Latent Chain-of-Thought: An Information-Theoretic Analysis

信息论分析潜在思维链监督

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 10:51

研究人员从信息论的角度分析了潜在思维链（Latent CoT），识别出梯度衰减和表征漂移等问题。他们提出了一种双重监督方法：轨迹监督用于逐步信号，空间监督用于保持潜在空间的语义。使用统一潜在探测器（ULP）进行的实验表明，推理准确性与潜在链中的信息保真度相关，这表明应转向最大化互信息而非几何模仿。 AI

影响为改进大型语言模型中的潜在推理提供了一个理论框架，有望带来更强大、更准确的内部思考过程。

排序理由学术论文，分析了一种特定的AI技术（潜在思维链），并提出了新颖的理论和实验贡献。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Xiaoyu Shen · 2026-06-18 10:51

潜在思维链中有效的监督是什么：一项信息论分析

Latent Chain-of-Thought (CoT) internalizes reasoning within continuous hidden states, offering a promising alternative to verbose discrete reasoning traces. However, robust latent reasoning remains difficult because outcome supervision provides weak learning signals and leaves la…

报道来源 [1]

潜在思维链中有效的监督是什么：一项信息论分析

相关实体

相关话题