PulseAugur
实时 09:11:19

扩大规模可改善大型语言模型的社会模拟能力,但存在局限性

一项新的研究论文探讨了扩大大型语言模型(LLMs)规模对其执行社会模拟能力的影响。研究发现,增加LLMs的计算规模,特别是使用Qwen3架构,显著提高了在意见建模和行为模拟等方面的性能,尤其对于英语网络数据中代表性强的群体。然而,对于纵向预测和代表性不足的意见,改进效果不太可靠,并且扩大规模并未增强与人类认知偏差或启发式方法的校准。 AI

影响 表明虽然扩大LLMs规模将改善大多数社会模拟任务,但诸如纵向预测和代表性不足的意见等特定领域可能需要超越单纯增加计算量之外的其他方法。

排序理由 研究论文发布在arXiv上,详细介绍了关于LLM规模扩大和社会模拟的发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

扩大规模可改善大型语言模型的社会模拟能力,但存在局限性

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Caleb Ziems, William Held, Su Doga Karaca, David Grusky, Tatsunori Hashimoto, Diyi Yang ·

    Will Scaling Improve Social Simulation with LLMs?

    arXiv:2607.02464v1 Announce Type: new Abstract: Large Language Model (LLM) social simulations are a promising research method, but they are not yet faithful enough to be adopted widely. In this work, we investigate whether the current scaling paradigm in language modeling is like…

  2. arXiv cs.CL TIER_1 English(EN) · Diyi Yang ·

    Will Scaling Improve Social Simulation with LLMs?

    Large Language Model (LLM) social simulations are a promising research method, but they are not yet faithful enough to be adopted widely. In this work, we investigate whether the current scaling paradigm in language modeling is likely to close these gaps, or whether simulation fi…