English(EN) Two Wrongs, No Right: Auditing Social-Desirability Bias in LLM Annotators for Computational Social Science

大型语言模型标注者在社会科学研究中表现出社会期望偏差

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 04:00

一篇新论文调查了用于计算社会科学的大型语言模型标注者中的社会期望偏差。研究人员发现，三个开源模型（Zephyr、Mistral-Instruct 和 Qwen2.5-Instruct）表现出不同类型的偏差，例如在标记有害内容时存在宽容或过度纠正。研究还表明，常用的提示技术不能有效减轻这些偏差，有时甚至会加剧它们，这凸显了计算社会科学研究中需要更可靠的验证方法。 AI

排序理由该集群包含一篇详细介绍大型语言模型偏差研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Varun Kotte · 2026-06-12 04:00

Two Wrongs, No Right: Auditing Social-Desirability Bias in LLM Annotators for Computational Social Science

arXiv:2606.12426v1 Announce Type: cross Abstract: LLM annotators are increasingly used in computational social science (CSS), but it is unclear whether their alignment-shaped errors preserve the empirical conclusions a researcher would report. We audit three open-source 7B instru…

报道来源 [1]

Two Wrongs, No Right: Auditing Social-Desirability Bias in LLM Annotators for Computational Social Science

相关实体

相关话题