English(EN) Predicting Effects, Missing Distributions: Evaluating LLMs as Human Behavior Simulators in Operations Management

大型语言模型可以模拟运营管理中的高级人类行为，但分布准确性参差不齐

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一篇新论文探讨了将大型语言模型（LLMs）用作运营管理中人类行为模拟器的可能性。研究人员发现，虽然大型语言模型通常可以复制行为-运营实验的高级结果，但其详细的响应分布经常与人类数据不同。该研究表明，诸如思维链提示和超参数调整等技术有助于减少这些分布不匹配，有时能使较小的或开源的模型表现与大型专有系统相当。 AI

影响这项研究表明，大型语言模型可用于模拟商业环境中高级人类行为，但强调需要仔细评估其分布准确性，并关注调整方法以提高性能的潜力。

排序理由评估大型语言模型在特定领域能力的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Runze Zhang, Xiaowei Zhang, Mingyang Zhao · 2026-06-30 04:00

预测效应，忽略分布：在运营管理中评估LLM作为人类行为模拟器

arXiv:2510.03310v2 Announce Type: replace-cross Abstract: Large language models (LLMs) are increasingly used to simulate human behavior in business, economics, and the social sciences, offering a low-cost complement to laboratory experiments, field studies, and surveys. This pape…

报道来源 [1]

预测效应，忽略分布：在运营管理中评估LLM作为人类行为模拟器

相关实体

相关话题