一篇新的研究论文探讨了语言模型中演绎推理的机制,区分了横向推理和纵向推理。该研究对符号蕴涵任务训练了小型 Transformer 模型,发现思维链(Chain-of-Thought)监督有助于模型学习基于规则的推理,而不是依赖统计捷径。对于横向推理,模型开发了可解释的电路来进行规则补全和决策;而对于纵向推理,思维链更像是一个用于获取复杂模式的课程学习工具。 AI
影响 提供了 Transformer 如何实现演绎推理的低层级描述,并提出了思维链在横向推理和纵向推理中具有不同功能。
排序理由 在 arXiv 上发表的研究论文,详细介绍了语言模型推理的发现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →