English(EN) Comparing Linear Probes with Mahalanobis Cosine Similarity

新理论将马氏余弦相似度与探针性能联系起来

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-19 04:00

研究人员在理论和实践上都证明了马氏余弦相似度（MCS）是线性探针的分布外 AUROC 的有力预测指标。这种关系在各种模型、层和概念域中都成立。该研究证明，对于具有高斯投影的平衡类别，分布外 AUROC 和到参考探针的 MCS 都是探针在测试数据上信噪比的线性函数。MCS 被提出作为一种理论上合理且实践有效的替代方法，用于在可解释性研究中比较线性探针，取代欧氏余弦相似度。 AI

影响提供了一种有理论依据的方法来评估 AI 模型的可解释性，有望增进对模型行为的理解。

排序理由该集群包含一篇学术论文，详细介绍了在机器学习可解释性中分析线性探针的新方法的理论和实证发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Zhuofan Josh Ying, Peter Hase, Nikolaus Kriegeskorte · 2026-06-19 04:00

Comparing Linear Probes with Mahalanobis Cosine Similarity

arXiv:2606.19603v1 Announce Type: new Abstract: Linear probes are widely used in interpretability research and often compared by cosine similarity. The Mahalanobis cosine similarity (MCS) between two directions, which reweights the inner product by test data covariance, is a natu…

报道来源 [1]

Comparing Linear Probes with Mahalanobis Cosine Similarity

相关实体

相关话题