PulseAugur
实时 03:16:44
English(EN) Predicting Effects, Missing Distributions: Evaluating LLMs as Human Behavior Simulators in Operations Management

大型语言模型可以模拟运营管理中的高级人类行为,但分布准确性参差不齐

一篇新论文探讨了将大型语言模型(LLMs)用作运营管理中人类行为模拟器的可能性。研究人员发现,虽然大型语言模型通常可以复制行为-运营实验的高级结果,但其详细的响应分布经常与人类数据不同。该研究表明,诸如思维链提示和超参数调整等技术有助于减少这些分布不匹配,有时能使较小的或开源的模型表现与大型专有系统相当。 AI

影响 这项研究表明,大型语言模型可用于模拟商业环境中高级人类行为,但强调需要仔细评估其分布准确性,并关注调整方法以提高性能的潜力。

排序理由 评估大型语言模型在特定领域能力的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

大型语言模型可以模拟运营管理中的高级人类行为,但分布准确性参差不齐

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Runze Zhang, Xiaowei Zhang, Mingyang Zhao ·

    预测效应,忽略分布:在运营管理中评估LLM作为人类行为模拟器

    arXiv:2510.03310v2 Announce Type: replace-cross Abstract: Large language models (LLMs) are increasingly used to simulate human behavior in business, economics, and the social sciences, offering a low-cost complement to laboratory experiments, field studies, and surveys. This pape…