(CA) Phoenix: Safe GitHub Issue Resolution via Multi-Agent LLMs

Phoenix LLM系统通过安全控制自动化GitHub问题解决

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-18 13:56

一个名为Phoenix的新型多智能体LLM系统已被开发出来，用于自动化GitHub问题的解决，从初步分类到创建拉取请求。该系统包含七层安全控制和一个基线感知测试策略，以确保可靠性。Phoenix将任务分解为六个专业智能体，包括规划者、复现者、编码者、测试者、故障分析师和一个PR智能体，所有这些都由一个Webhook状态机协调。该系统在精选的SWE-bench Lite数据集上展示了75%的Oracle解决率，并在真实世界问题上保持了100%的正确性保留，尽管一些拉取请求需要改进规划者本地化。 AI

影响该系统可以通过自动化问题解决和提高代码质量，显著简化软件开发工作流程。

排序理由该条目描述了一篇研究论文，其中详细介绍了一个用于特定软件工程任务的新型多智能体LLM系统。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.MA (Multiagent) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.MA (Multiagent) TIER_1 (CA) · Joao Barros · 2026-06-18 13:56

Phoenix：通过多代理LLM实现安全的GitHub问题解决方案

We present Phoenix, a multi-agent LLM system that resolves GitHub issues from triage through pull-request creation, combining seven layered safety controls with a baseline-aware test evaluation strategy. Phoenix decomposes the work across six specialized agents. Planner, reproduc…

报道来源 [1]

Phoenix：通过多代理LLM实现安全的GitHub问题解决方案

相关实体

相关话题