English(EN) ProtocolBench: Which LLM MultiAgent Protocol to Choose?

新的基准测试 ProtocolBench 评估 LLM 多智能体通信协议

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员推出了 ProtocolBench，这是一个旨在系统评估大规模多智能体系统中使用的通信协议的性能和可靠性的新基准。该基准衡量任务成功率、延迟、消息开销和故障下的鲁棒性，揭示了不同协议之间显著的性能差异。此外，该研究还提出了 ProtocolRouter，一个自适应系统，可根据特定场景需求和运行时信号选择最合适的协议，与静态协议选择相比，显示出更短的恢复时间和更高的任务成功率。 AI

影响标准化 LLM 多智能体通信的评估，有望提高复杂 AI 系统的可靠性和效率。

排序理由该集群包含一篇学术论文，详细介绍了用于评估 LLM 多智能体协议的新基准和系统。[lever_c_research降级：ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Hongyi Du, Jiaqi Su, Jisen Li, Lijie Ding, Yingxuan Yang, Peixuan Han, Xiangru Tang, Kunlun Zhu, Jiaxuan You · 2026-06-03 04:00

ProtocolBench：应选择哪个LLM多代理协议？

arXiv:2510.17149v3 Announce Type: replace Abstract: As large-scale multi-agent systems evolve, the communication protocol layer has become a critical yet under-evaluated factor shaping performance and reliability. Despite the existence of diverse protocols (A2A, ACP, ANP, Agora, …

报道来源 [1]

ProtocolBench：应选择哪个LLM多代理协议？

相关话题