English(EN) PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction

新的PLOT框架加速神经网络可解释性研究

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-07 21:52

研究人员开发了PLOT，一个用于神经网络机械可解释性的新框架。PLOT利用最优传输高效地定位神经网络计算中的因果变量。该方法通过提供一种更有针对性的识别相关神经位点的方法，加速了诸如分布式对齐搜索（DAS）等现有技术，使因果抽象研究更具可扩展性和准确性。 AI

影响能够更高效、可扩展地研究神经网络的内部工作原理。

排序理由该集群包含一篇详细介绍新研究方法的学术论文。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv stat.ML TIER_1 English(EN) · Jonathn Chang, Arya Datla, Ziv Goldfeld · 2026-05-11 04:00

PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction

arXiv:2605.06979v1 Announce Type: cross Abstract: Causal abstraction offers a principled framework for mechanistic interpretability, aligning a high-level causal model with the low-level computation realized by a neural network through counterfactual intervention analysis. Existi…
arXiv stat.ML TIER_1 English(EN) · Ziv Goldfeld · 2026-05-07 21:52

PLOT: Progressive Localization via Optimal Transport in Neural Causal Abstraction

Causal abstraction offers a principled framework for mechanistic interpretability, aligning a high-level causal model with the low-level computation realized by a neural network through counterfactual intervention analysis. Existing methods such as distributed alignment search (D…