English(EN) The Grammar of Transformers: A Systematic Review of Interpretability Research on Syntactic Knowledge in Language Models

综述发现 Transformer 编码了重要的句法知识

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

对 337 篇文章的系统性综述表明，基于 Transformer 的语言模型 (TLMs) 拥有大量的句法知识。虽然这些模型在形式句法任务上表现良好，但在句法-语义接口和对数字支持较少的语言上的表现较弱。尽管有句法知识的证据，但当前的研究方法过于多样化和观察性，无法完全理解其底层的计算机制，并且研究高度集中在英语和类 BERT 模型上。 AI

影响证实了当前的 LLMs 拥有大量的句法知识，但对其底层机制的理解仍然有限。

排序理由这是一篇系统性综述论文，分析了关于语言模型的现有研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Nora Graichen, Iria de-Dios-Flores, Gemma Boleda · 2026-05-28 04:00

The Grammar of Transformers: A Systematic Review of Interpretability Research on Syntactic Knowledge in Language Models

arXiv:2601.19926v2 Announce Type: replace-cross Abstract: We present a systematic review of 337 articles evaluating the syntactic abilities of Transformer-based language models (TLMs), reporting on over 3,000 datapoints spanning a wide range of syntactic phenomena, languages, mod…

报道来源 [1]

The Grammar of Transformers: A Systematic Review of Interpretability Research on Syntactic Knowledge in Language Models

相关实体

相关话题