宾夕法尼亚州立大学和杜克大学的研究人员,以及来自 Google DeepMind 等机构的合作者,为 LLM 多代理系统引入了一个新的研究问题,称为“自动化故障归因”。他们开发了第一个基准数据集“Who&When”以及几种自动识别哪个代理导致了任务失败以及在哪个时间点的方法。这项工作旨在简化目前耗时的人工调试过程,并提高复杂多代理系统的整体可靠性。该论文已被 ICML 2025 接受为 Spotlight 演示,代码和数据集现已开源。 AI
排序理由 研究论文,为 LLM 多代理系统引入了新问题和数据集。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →