English(EN) SWE-Doctor: Guiding Software Engineering Agents with Runtime Diagnosis from Multi-Faceted Bug Reproduction Tests

SWE-Doctor 代理利用运行时诊断改进 LLM 补丁生成

作者 PulseAugur 编辑部 · [2 个来源] · 2026-07-01 14:27

研究人员开发了 SWE-Doctor，这是一种旨在提高基于 LLM 的软件工程代理生成代码补丁准确性的新型代理。与直接使用错误重现测试 (BRTs) 的先前方法不同，SWE-Doctor 分析多方面的 BRTs 以获得运行时诊断。这些诊断结合本地化信息，指导补丁生成过程，显著减少了部分补丁的出现。在 SWE-bench Verified 和 SWE-bench Pro 的 Python 错误修复问题上的评估表明，SWE-Doctor 在各种 LLM 后端上均表现出色，分别实现了 75.7% 和 59.4% 的解决率。 AI

影响增强了 LLM 在自动化代码修复方面的能力，可能导致更高效的软件开发周期。

排序理由该集群包含一篇详细介绍基于 LLM 的软件工程代理新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Yaoqi Guo, Yang Liu, Jie M. Zhang, Yun Ma, Yiling Lou, Zhenpeng Chen · 2026-07-02 04:00

SWE-Doctor: Guiding Software Engineering Agents with Runtime Diagnosis from Multi-Faceted Bug Reproduction Tests

arXiv:2607.00990v1 Announce Type: cross Abstract: Large language model (LLM)-based software engineering agents are increasingly developed to resolve software issues by generating patches from issue reports and code repositories. Bug reproduction tests (BRTs) are an important buil…
arXiv cs.AI TIER_1 English(EN) · Zhenpeng Chen · 2026-07-01 14:27

SWE-Doctor：通过多方面错误复现测试的运行时诊断来指导软件工程代理

Large language model (LLM)-based software engineering agents are increasingly developed to resolve software issues by generating patches from issue reports and code repositories. Bug reproduction tests (BRTs) are an important building block for such agents and have been shown use…

报道来源 [2]

SWE-Doctor: Guiding Software Engineering Agents with Runtime Diagnosis from Multi-Faceted Bug Reproduction Tests

SWE-Doctor：通过多方面错误复现测试的运行时诊断来指导软件工程代理

相关实体

相关话题