一篇题为《审议的幻觉》的新研究论文指出了多智能体LLM系统中的一个重大问题,即共识常被误认为是成功的审议。研究表明,这些系统遭受“事实流失”,在讨论中丢失关键事实,以及“立场同质化”,即不同的观点汇聚成单一的共识。研究人员使用一个名为DelibTrace的框架发现,在多智能体LLM讨论中,多达72%的关键事实会丢失,导致错误的解读并强化基础模型的偏见。 AI
影响 凸显了多智能体LLM系统的一个关键缺陷,表明当前的评估可能不足,并对可靠的AI决策构成风险。
排序理由 学术论文发表在arXiv上,详细介绍了关于LLM行为的新发现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →