PulseAugur
实时 15:26:12
English(EN) Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games

新的提示方法改进了LLM对人类决策模拟

研究人员开发了一种名为“方程到行为提示”(Equation-to-Behavior Prompting)的新方法,用于指导大型语言模型(LLM)模拟多样化的人类决策行为,超越了简单的贝叶斯更新。该方法在说服博弈中进行了测试,结果表明,较大的模型可以通过提示来近似指定的认知模型。对于较小的模型,一种名为“方程到行为强化学习”(Equation-to-Behavior RL)的技术显著减少了信念误差,尤其是在分布外场景中。与仅在贝叶斯模型上进行训练相比,使用这些多样化的决策者模拟来训练较小的模型,可以提高其平均信念变化,即使在与GPT-5-mini等模型交互时也是如此。 AI

影响 通过实现更真实的多样化人类决策模拟,增强了LLM的训练和评估。

排序理由 该集群包含一篇学术论文,详细介绍了一种改进LLM人类行为模拟的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Zirui Cheng, Zeyu Shen, Thomas L. Griffiths, Peter Henderson ·

    Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games

    arXiv:2606.17657v1 Announce Type: new Abstract: People make decisions differently in strategic interactions. Some update beliefs like a Bayesian; others exhibit biases like motivated reasoning. Although creators of large language models use simulated humans for safety evaluations…