一项新的研究论文探讨了扩大大型语言模型(LLMs)规模对其执行社会模拟能力的影响。研究发现,增加LLMs的计算规模,特别是使用Qwen3架构,显著提高了在意见建模和行为模拟等方面的性能,尤其对于英语网络数据中代表性强的群体。然而,对于纵向预测和代表性不足的意见,改进效果不太可靠,并且扩大规模并未增强与人类认知偏差或启发式方法的校准。 AI
影响 表明虽然扩大LLMs规模将改善大多数社会模拟任务,但诸如纵向预测和代表性不足的意见等特定领域可能需要超越单纯增加计算量之外的其他方法。
排序理由 研究论文发布在arXiv上,详细介绍了关于LLM规模扩大和社会模拟的发现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →