研究人员发现,使用大型语言模型(LLM)模拟人类行为进行实验研究存在一个关键缺陷。由于LLM是在观察性数据上训练的,干预措施可能会无意中改变模拟用户的基本属性,导致“用户漂移”。这种漂移会扭曲干预措施的估计效应,使实验结果不可靠。该研究提出了使用负面对照结果来诊断这种混淆的方法,并通过调整具有相关混淆因素的LLM角色来缓解它。 AI
影响 强调了在使用LLM进行实验研究时的一个潜在陷阱,影响了行为科学和AI研究中研究结果的可靠性。
排序理由 学术论文,详细介绍了LLM模拟的方法论问题。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →