研究人员开发了一个新框架,用于评估大规模多智能体大型语言模型(LLM)系统的协调动态。该框架解决了当前仅关注单个智能体或小群体的现有方法的局限性。它在 MoltBook Observatory Archive 上进行了演示,分析了 90,704 个自主智能体之间超过 273 万次交互,为涌现协调建立了量化基线。 AI
影响 为评估大规模语言模型智能体系统中涌现协调提供了一种标准化方法。
排序理由 学术论文,介绍了一种用于多智能体语言模型系统的新评估框架。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →