PulseAugur
实时 10:49:09
English(EN) Which Agent Causes Task Failures and When?Researchers from PSU and Duke explores automated failure attribution of LLM Multi-Agent Systems

哪个代理导致任务失败以及何时发生?宾夕法尼亚州立大学和杜克大学的研究人员探索了 LLM 多代理系统的自动化故障归因

宾夕法尼亚州立大学和杜克大学的研究人员,以及来自 Google DeepMind 等机构的合作者,为 LLM 多代理系统引入了一个新的研究问题,称为“自动化故障归因”。他们开发了第一个基准数据集“Who&When”以及几种自动识别哪个代理导致了任务失败以及在哪个时间点的方法。这项工作旨在简化目前耗时的人工调试过程,并提高复杂多代理系统的整体可靠性。该论文已被 ICML 2025 接受为 Spotlight 演示,代码和数据集现已开源。 AI

排序理由 研究论文,为 LLM 多代理系统引入了新问题和数据集。

在 Synced Review 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

哪个代理导致任务失败以及何时发生?宾夕法尼亚州立大学和杜克大学的研究人员探索了 LLM 多代理系统的自动化故障归因

报道来源 [2]

  1. Synced Review TIER_1 English(EN) · Synced ·

    Which Agent Causes Task Failures and When?Researchers from PSU and Duke explores automated failure attribution of LLM Multi-Agent Systems

    <p>In recent years, LLM Multi-Agent systems have garnered widespread attention for their collaborative approach to solving complex problems. However, it's a common scenario for these systems to fail at a task despite a flurry of activity.</p> The post <a href="https://syncedrevie…

  2. Synced Review TIER_1 English(EN) · Synced ·

    Researchers from PSU and Duke introduce “Multi-Agent Systems Automated Failure Attribution

    <p>"Automated failure attribution" is a crucial component in the development lifecycle of Multi-Agent systems. It has the potential to transform the challenge of identifying "what went wrong and who is to blame" from a perplexing mystery into a quantifiable and analyzable problem…