English(EN) The SuperActivator Mechanism: Transformers Concentrate Reliable Concept Signals in the Tail

SuperActivator 机制增强 Transformer 的概念检测能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-01 04:00

研究人员在 Transformer 中发现了一种“SuperActivator 机制”，该机制将可靠的概念信号集中在一小部分高激活 token 中。该机制放大了概念激活的差距，在概念内的分布中形成了一个与噪声分离的、明显的正尾部。这一发现提高了概念检测的准确性，在各种模型和模态中将 F1 分数提高了高达 0.14。 AI

影响识别出一种在 Transformer 中进行更可靠概念检测的机制，有可能提高可解释性和下游应用。

排序理由该集群包含一篇详细介绍 Transformer 模型新机制的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Cassandra Goldberg, Chaehyeon Kim, Adam Stein, Eric Wong · 2026-06-01 04:00

SuperActivator 机制：Transformer 将可靠概念信号集中在尾部

arXiv:2512.05038v2 Announce Type: replace Abstract: Concept vectors aim to enhance model interpretability by linking internal representations with human-understandable semantics, but their practical utility is often limited by noisy and inconsistent activations. In this work, we …

报道来源 [1]

SuperActivator 机制：Transformer 将可靠概念信号集中在尾部

相关实体

相关话题