PulseAugur
实时 21:20:47
English(EN) When Reasoning Models Hurt Behavioral Simulation: A Solver-Sampler Mismatch in Multi-Agent LLM Negotiation

LLM推理模型在多智能体谈判中未能进行行为模拟

一篇新的研究论文探讨了用于多智能体谈判的大型语言模型在推理能力与行为模拟之间的不匹配问题。研究发现,像DeepSeek和OpenAI的GPT-5.2这样的模型,当利用其推理能力时,常常会默认产生权威驱动的结果,而不是协商的结果。该论文认为,根据模型预期的行为角色而非仅仅战略能力来评估模型,对于准确的制度模拟至关重要。 AI

影响 强调了在模拟中评估LLM特定行为角色的必要性,而不仅仅是原始战略能力。

排序理由 该集群包含一篇详细介绍LLM行为研究结果的arXiv论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM推理模型在多智能体谈判中未能进行行为模拟

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Sandro Andric ·

    When Reasoning Models Hurt Behavioral Simulation: A Solver-Sampler Mismatch in Multi-Agent LLM Negotiation

    arXiv:2604.11840v2 Announce Type: replace Abstract: Behavioral simulation and strategic problem solving are different tasks. Large language models are increasingly explored as agents in policy-facing institutional simulations, but stronger reasoning need not improve behavioral sa…