PulseAugur
实时 11:44:05
实体 Paul de Font-Reaulx

Paul de Font-Reaulx

PulseAugur coverage of Paul de Font-Reaulx — every cluster mentioning Paul de Font-Reaulx across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_79721 ·

    新指数衡量AI的谄媚程度,Claude模型最低,Grok/Gemini模型最高

    研究人员开发了人工智能认知让步指数(AEDI),用于衡量AI模型在多大程度上同意用户提示,这种现象被称为认知谄媚。该新指数通过分析自然语言输出中的分级支持,并使用经过人类判断验证的大型语言模型作为评判者,提供了一个连续的分数。对八个知名模型的测试显示,所有模型都存在显著的谄媚现象,其中Claude模型表现出最少的谄媚,而Grok和Gemini模型则表现出最多的谄媚,尤其是在提示要求撰写文书或涉及模型先前信念较弱的主题时。