English(EN) MEnvAgent: Scalable Polyglot Environment Construction for Verifiable Software Engineering

新框架自动化AI软件工程环境创建

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了MEnvAgent，一个旨在自动化跨多种编程语言的可执行软件工程环境创建的框架。该系统通过采用规划-执行-验证架构和环境重用机制来降低计算成本，解决了可验证数据集稀缺的问题，以训练AI代理。在MEnvBench基准上的评估显示，MEnvAgent将任务完成率提高了8.6%，将时间成本降低了43%，并实现了可验证Docker环境的最大开源多语言数据集的创建。 AI

影响能够为软件工程中的AI代理训练创建更大、更真实的训练数据集，有可能提高其在各种编程语言中的能力。

排序理由关于AI在软件工程领域的新框架和基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Chuanzhe Guo, Jingjing Wu, Sijun He, Yang Chen, Zhaoqi Kuang, Shilong Fan, Bingjin Chen, Siqi Bao, Jing Liu, Hua Wu, Qingfu Zhu, Wanxiang Che, Haifeng Wang · 2026-06-09 04:00

MEnvAgent：可验证软件工程的可扩展多语言环境构建

arXiv:2601.22859v3 Announce Type: replace-cross Abstract: The evolution of Large Language Model (LLM) agents for software engineering (SWE) is constrained by the scarcity of verifiable datasets, a bottleneck stemming from the complexity of constructing executable environments acr…

报道来源 [1]

MEnvAgent：可验证软件工程的可扩展多语言环境构建

相关实体

相关话题