English(EN) Feature Identification via the Empirical NTK

eNTK特征值分析揭示了训练过的神经网络中的特征

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-07 04:00

研究人员已经证明，分析经验神经切线核（eNTK）可以揭示训练过的神经网络中的特征方向。该方法在1层MLP和1层Transformer上进行了测试，结果表明eNTK的顶部特征空间与真实或可解释的特征对齐。对于预训练语言模型Gemma-3-270M，eNTK的特征向量在语法特征上的对齐效果优于模型激活上的PCA，这表明eNTK特征值分析可作为一种机制可解释性工具。 AI

影响引入了一种理解模型内部表征的新技术，可能有助于可解释性研究。

排序理由学术论文，详细介绍了一种分析神经网络特征的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Jennifer Lin · 2026-05-07 04:00

通过经验NTK进行特征识别

arXiv:2510.00468v4 Announce Type: replace Abstract: We provide evidence that eigenanalysis of the empirical neural tangent kernel (eNTK) can surface feature directions in trained neural networks. Across three increasingly realistic settings -- a 1-layer MLP trained on modular add…

报道来源 [1]

通过经验NTK进行特征识别

相关实体

相关话题