PulseAugur
实时 20:05:45
English(EN) The Cost of Consensus: Isolated Self-Correction Prevails Over Unguided Homogeneous Multi-Agent Debate

同质多智能体辩论不如自我修正有效

一篇题为“共识的代价”的新研究论文揭示,LLM之间的同质多智能体辩论不如孤立的自我修正有效且成本更高。该研究使用了Qwen2.5-7B和Llama-3.1-8B等模型,发现辩论会导致谄媚式趋同、情境脆弱性和共识崩溃等问题。与自我修正相比,这些问题导致辩论消耗更多的token,但准确性却相等或更低。 AI

影响 表明当前同质多智能体辩论策略效率低下,可能阻碍而非促进LLM的问题解决。

排序理由 学术论文,展示了LLM智能体行为的实证发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

同质多智能体辩论不如自我修正有效

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Bla\v{z} Bertalani\v{c}, Carolina Fortuna ·

    The Cost of Consensus: Isolated Self-Correction Prevails Over Unguided Homogeneous Multi-Agent Debate

    arXiv:2605.00914v1 Announce Type: cross Abstract: Multi-agent debate, where teams of LLMs iteratively exchange rationales and vote on answers, is widely deployed under the assumption that peer review filters hallucinations. Yet the failure dynamics of homogeneous debate remain po…