PulseAugur
实时 08:53:07

AI模型通过GitHub Pull Request训练后代码编辑能力提升

研究人员开发了一种名为Clean Pull Request (Clean-PR)的新方法,用于训练用于仓库级别代码编辑的AI模型。该方法利用真实的GitHub Pull Request,将其转换为包含12种编程语言的200多万个编辑的结构化数据集。通过使用这些数据训练模型,研究人员在SWE-bench基准测试中取得了显著的性能提升,并且在推理过程中无需复杂的代理脚手架。 AI

影响 增强了AI执行复杂、多文件代码修改的能力,可能简化软件开发工作流程。

排序理由 关于AI代码编辑新训练方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Qinglin Zhu, Tianyu Chen, Shuai Lu, Lei Ji, Runcong Zhao, Murong Ma, Xiangxiang Dai, Yulan He, Lin Gui, Peng cheng, Yeyun Gong ·

    Pull Requests as a Training Signal for Repo-Level Code Editing

    arXiv:2602.07457v2 Announce Type: replace-cross Abstract: Repository-level code editing requires models to understand complex dependencies and execute precise multi-file modifications across a large codebase. While recent gains on SWE-bench rely heavily on complex agent scaffoldi…