PulseAugur
实时 10:22:50
实体 Lindsey et al.

Lindsey et al.

PulseAugur coverage of Lindsey et al. — every cluster mentioning Lindsey et al. across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_86836 ·

    语言模型神经元被发现是稀疏的,有助于可解释性

    研究人员已经证明,语言模型MLP层内的神经元表现出的稀疏度与稀疏自编码器(SAE)相当。这一发现使得开发用于电路追踪的基于梯度的管道成为可能,从而能够识别出具有因果效应的神经元。该方法已成功识别出约100个MLP神经元组成的电路,用于控制模型在主谓一致任务上的行为,并揭示了用于多跳城市-州-首都任务的推理步骤的特定神经元集,在没有额外训练成本的情况下推进了自动化可解释性。