(CA) Phoenix: Safe GitHub Issue Resolution via Multi-Agent LLMs

多智能体 LLM 系统 Phoenix 自动化 GitHub 问题解决

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 13:56

研究人员开发了 Phoenix，一个旨在自动解决 GitHub 问题多智能体 LLM 系统。该系统利用六个专业智能体，包括规划者、编码者和测试者，来管理从问题分类到创建 pull request 的整个过程。Phoenix 包含七层安全控制和一种基线感知测试策略，在精选的 SWE-bench Lite 切片上实现了 75% 的预言家解决率，并在真实问题试点研究中保持了 100% 的正确性保留。 AI

影响这项研究展示了向自主软件开发和维护迈出的重要一步，有可能简化开发人员的工作流程。

排序理由该集群描述了一篇研究论文，其中详细介绍了一种使用 LLM 进行自动化问题解决的新颖系统。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.MA (Multiagent) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.MA (Multiagent) TIER_1 (CA) · Joao Barros · 2026-06-18 13:56

Phoenix: Safe GitHub Issue Resolution via Multi-Agent LLMs

We present Phoenix, a multi-agent LLM system that resolves GitHub issues from triage through pull-request creation, combining seven layered safety controls with a baseline-aware test evaluation strategy. Phoenix decomposes the work across six specialized agents. Planner, reproduc…

报道来源 [1]

Phoenix: Safe GitHub Issue Resolution via Multi-Agent LLMs

相关实体

相关话题