PulseAugur
实时 06:10:43
实体 turn-averaged SAEs

turn-averaged SAEs

PulseAugur coverage of turn-averaged SAEs — every cluster mentioning turn-averaged SAEs across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_117776 ·

    新的SAE方法简化了长上下文语言模型的解释性

    研究人员开发了轮次平均稀疏自编码器(SAE)来提高语言模型的解释性,尤其是在长上下文方面。与处理单个token激活的标准SAE不同,新方法在整个轮次(人类或助手)上平均激活,用固定数量的特征来表示它。这种方法简化了对长模型对话记录的研究,并使解释性技术在扩展上下文中更加实用。