PulseAugur
实时 12:52:19
English(EN) Deductive Logic in Language Models: Horizontal vs Vertical Reasoning

新研究详细介绍语言模型中的演绎推理

一篇新的研究论文探讨了语言模型中演绎推理的机制,区分了横向推理和纵向推理。该研究对符号蕴涵任务训练了小型 Transformer 模型,发现思维链(Chain-of-Thought)监督有助于模型学习基于规则的推理,而不是依赖统计捷径。对于横向推理,模型开发了可解释的电路来进行规则补全和决策;而对于纵向推理,思维链更像是一个用于获取复杂模式的课程学习工具。 AI

影响 提供了 Transformer 如何实现演绎推理的低层级描述,并提出了思维链在横向推理和纵向推理中具有不同功能。

排序理由 在 arXiv 上发表的研究论文,详细介绍了语言模型推理的发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新研究详细介绍语言模型中的演绎推理

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Davide Maltoni, Matteo Ferrara ·

    Deductive Logic in Language Models: Horizontal vs Vertical Reasoning

    arXiv:2510.09340v2 Announce Type: replace Abstract: Recent language models exhibit significant logical reasoning abilities, yet the mechanisms supporting deductive inference remain poorly understood. This paper studies small transformer-based language models trained from scratch …