研究人员开发了MEnvAgent,一个旨在自动化跨多种编程语言的可执行软件工程环境创建的框架。该系统通过采用规划-执行-验证架构和环境重用机制来降低计算成本,解决了可验证数据集稀缺的问题,以训练AI代理。在MEnvBench基准上的评估显示,MEnvAgent将任务完成率提高了8.6%,将时间成本降低了43%,并实现了可验证Docker环境的最大开源多语言数据集的创建。 AI
影响 能够为软件工程中的AI代理训练创建更大、更真实的训练数据集,有可能提高其在各种编程语言中的能力。
排序理由 关于AI在软件工程领域的新框架和基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →