研究人员开发了 SWE-Doctor,这是一种旨在提高基于 LLM 的软件工程代理生成代码补丁准确性的新型代理。与直接使用错误重现测试 (BRTs) 的先前方法不同,SWE-Doctor 分析多方面的 BRTs 以获得运行时诊断。这些诊断结合本地化信息,指导补丁生成过程,显著减少了部分补丁的出现。在 SWE-bench Verified 和 SWE-bench Pro 的 Python 错误修复问题上的评估表明,SWE-Doctor 在各种 LLM 后端上均表现出色,分别实现了 75.7% 和 59.4% 的解决率。 AI
影响 增强了 LLM 在自动化代码修复方面的能力,可能导致更高效的软件开发周期。
排序理由 该集群包含一篇详细介绍基于 LLM 的软件工程代理新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →