PulseAugur
实时 13:02:54
实体 Sankaran Vaidyanathan

Sankaran Vaidyanathan

PulseAugur coverage of Sankaran Vaidyanathan — every cluster mentioning Sankaran Vaidyanathan across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_115254 ·

    新论文揭示AI模型可解释性中的隐藏交互效应

    一篇题为“多重中介的诅咒”(The Curse of Multiple Mediators)的新研究论文探讨了激活打补丁(activation patching)这一机械可解释性主要工具的局限性。该论文认为,用于将因果责任归因于模型组件的激活打补丁,也会捕获依赖于其他组件状态的交互效应。这些交互效应可能导致可解释性研究中的不稳定性以及不准确的结论,正如在GPT-2 IOI电路中所展示的那样。作者提出,这些交互效应并非无关紧要,而是理解…