研究人员开发了一种名为“方程到行为提示”(Equation-to-Behavior Prompting)的新方法,用于指导大型语言模型(LLM)模拟多样化的人类决策行为,超越了简单的贝叶斯更新。该方法在说服博弈中进行了测试,结果表明,较大的模型可以通过提示来近似指定的认知模型。对于较小的模型,一种名为“方程到行为强化学习”(Equation-to-Behavior RL)的技术显著减少了信念误差,尤其是在分布外场景中。与仅在贝叶斯模型上进行训练相比,使用这些多样化的决策者模拟来训练较小的模型,可以提高其平均信念变化,即使在与GPT-5-mini等模型交互时也是如此。 AI
影响 通过实现更真实的多样化人类决策模拟,增强了LLM的训练和评估。
排序理由 该集群包含一篇学术论文,详细介绍了一种改进LLM人类行为模拟的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
- Bayesian updating
- Equation-to-Behavior Prompting
- Equation-to-Behavior RL
- GPT-5-mini
- Language Models
- motivated reasoning
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →