新的剪枝方法可实现LLM中细粒度的因果电路发现

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员开发了一种新颖的节点级剪枝框架，用于在大型语言模型（LLMs）中发现因果电路。该方法可以更细粒度地识别关键子网络，精确到单个神经元，克服了现有边缘剪枝技术（侧重于注意力头或MLP块等较粗粒度单元）的局限性。该框架使用可学习的掩码和特定于粒度的稀疏性惩罚，在单次微调运行中实现全面的压缩，与先前的方法相比，发现的电路更小，内存占用显著降低。 AI

影响这项研究提供了一种更有效、更细粒度的方法来理解LLM的内部工作机制，可能有助于提高可解释性和进行有针对性的模型改进。

排序理由该集群包含一篇在arXiv上发表的学术论文，详细介绍了一种新的AI研究方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 Română(RO) · Muhammad Umair Haider, Hammad Rizwan, Hassan Sajjad, A. B. Siddique · 2026-06-16 04:00

Multi-Granular Node Pruning for Causal Circuit Discovery

arXiv:2512.10903v2 Announce Type: replace Abstract: Circuit discovery aims to identify minimal subnetworks that are responsible for specific behaviors in large language models (LLMs). Existing approaches primarily rely on iterative edge pruning, which is computationally expensive…

报道来源 [1]

Multi-Granular Node Pruning for Causal Circuit Discovery

相关实体

相关话题