PulseAugur
实时 14:36:04
实体 Who&When

Who&When

PulseAugur coverage of Who&When — every cluster mentioning Who&When across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_05786 ·

    哪个代理导致任务失败以及何时发生?宾夕法尼亚州立大学和杜克大学的研究人员探索了 LLM 多代理系统的自动化故障归因

    宾夕法尼亚州立大学和杜克大学的研究人员,以及来自 Google DeepMind 等机构的合作者,为 LLM 多代理系统引入了一个新的研究问题,称为“自动化故障归因”。他们开发了第一个基准数据集“Who&When”以及几种自动识别哪个代理导致了任务失败以及在哪个时间点的方法。这项工作旨在简化目前耗时的人工调试过程,并提高复杂多代理系统的整体可靠性。该论文已被 ICML 2025 接受为 Spotlight 演示,代码和数据集现已开源。