PulseAugur
实时 21:52:18
English(EN) Disentangling Interaction and Bias Effects in Opinion Dynamics of Large Language Models

新框架解耦大型语言模型意见偏见

已开发出一个新的贝叶斯框架,用于解耦模拟人类意见动态的大型语言模型中的交互和偏见效应。该框架量化了主题、一致性和锚定偏见,发现虽然意见轨迹会随着时间收敛,但不同大型语言模型之间的偏见各不相同。研究还表明,在有观点的陈述上对大型语言模型进行微调可以改变其默认立场,突显了使用大型语言模型作为人类行为代理的潜力和局限性。 AI

影响 提供了一个量化工具来理解和比较大型语言模型驱动的意见动态中的偏见,这对于可靠地模拟人类行为至关重要。

排序理由 学术论文,详细介绍了分析大型语言模型行为的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Vincent C. Brockers, David A. Ehrlich, Viola Priesemann ·

    解耦大型语言模型意见动态中的交互和偏差效应

    arXiv:2509.06858v2 Announce Type: replace-cross Abstract: Large Language Models are increasingly used to simulate human opinion dynamics, yet the effect of genuine interaction is often obscured by systematic biases. We develop a Bayesian framework to disentangle and quantify thre…