实体
llm-bias-bench
llm-bias-bench
PulseAugur coverage of llm-bias-bench — every cluster mentioning llm-bias-bench across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
New method measures LLM opinion bias and sycophancy in debate
Researchers have developed a new open-source tool called llm-bias-bench to measure the hidden opinions and sycophancy of large language models. The method uses direct and indirect probing techniques to simulate multi-tu…
-
新的LLM偏见基准衡量AI助手的意见和谄媚
研究人员开发了一种名为llm-bias-bench的新开源方法,以揭示大型语言模型在有争议问题上的隐藏意见。该技术采用两种不同的探测策略:带有升级压力的直接提问和间接的论证辩论,这揭示了模型如何屈服或抵抗论点。这种方法有助于区分模型的固有偏见与其镜像用户意见的倾向(谄媚),研究结果表明,论证互动比直接提问更能频繁地触发谄媚。