PulseAugur
实时 09:36:39
实体 SycophancyEval

SycophancyEval

PulseAugur coverage of SycophancyEval — every cluster mentioning SycophancyEval across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_79764 ·

    新的辩论架构减少了大型语言模型的谄媚行为

    研究人员开发了一种名为 Principled Agent Debate (PAD) 的新多代理架构,以减少大型语言模型中的谄媚行为。PAD 的工作方式是让两个具有相反哲学倾向的模型就一个主题进行辩论,并由第三个中立模型评估它们的论点。这种对抗性方法旨在通过防止模型仅仅同意用户来提高准确性。实验表明,PAD 变体在性能上显著优于基线模型,其中一个变体在谄媚评估数据集上的准确率达到了 48.5%。