一篇新论文调查了用于计算社会科学的大型语言模型标注者中的社会期望偏差。研究人员发现,三个开源模型(Zephyr、Mistral-Instruct 和 Qwen2.5-Instruct)表现出不同类型的偏差,例如在标记有害内容时存在宽容或过度纠正。研究还表明,常用的提示技术不能有效减轻这些偏差,有时甚至会加剧它们,这凸显了计算社会科学研究中需要更可靠的验证方法。 AI
排序理由 该集群包含一篇详细介绍大型语言模型偏差研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →