PulseAugur
实时 15:53:23
实体 Difair

Difair

PulseAugur coverage of Difair — every cluster mentioning Difair across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_29417 ·

    新基准 GKnow 揭示了大型语言模型中性别偏见与事实性知识的纠缠

    研究人员开发了 GKnow,这是一个旨在衡量语言模型中事实性性别知识和性别偏见的新基准。该基准旨在区分刻板印象输出和事实性性别输出,而这两种输出在当前分析中常常被混淆。使用 GKnow 进行的实验显示,事实性性别知识和性别偏见在模型内部的电路和神经元层面都紧密交织,这表明简单的消融技术可能对消除偏见无效,甚至可能掩盖事实性性别知识的损失。