一篇题为“共识的代价”的新研究论文揭示,LLM之间的同质多智能体辩论不如孤立的自我修正有效且成本更高。该研究使用了Qwen2.5-7B和Llama-3.1-8B等模型,发现辩论会导致谄媚式趋同、情境脆弱性和共识崩溃等问题。与自我修正相比,这些问题导致辩论消耗更多的token,但准确性却相等或更低。 AI
影响 表明当前同质多智能体辩论策略效率低下,可能阻碍而非促进LLM的问题解决。
排序理由 学术论文,展示了LLM智能体行为的实证发现。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →