English(EN) The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study

LLM模拟可能因用户漂移误导研究人员

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-20 06:09

研究人员发现，使用大型语言模型（LLM）模拟人类行为进行实验研究存在一个关键缺陷。由于LLM是在观察性数据上训练的，干预措施可能会无意中改变模拟用户的基本属性，导致“用户漂移”。这种漂移会扭曲干预措施的估计效应，使实验结果不可靠。该研究提出了使用负面对照结果来诊断这种混淆的方法，并通过调整具有相关混淆因素的LLM角色来缓解它。 AI

影响强调了在使用LLM进行实验研究时的一个潜在陷阱，影响了行为科学和AI研究中研究结果的可靠性。

排序理由学术论文，详细介绍了LLM模拟的方法论问题。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Alexander D'Amour · 2026-05-20 06:09

干预的幻觉：您的LLM模拟实验是一项观察性研究

Large language models (LLMs) show potential as simulators of human behavior, offering a scalable way to study responses to interventions. However, because LLMs are trained largely on observational data, interventions in experiments with LLM-simulated synthetic users can induce un…

报道来源 [1]

干预的幻觉：您的LLM模拟实验是一项观察性研究

相关实体

相关话题