PulseAugur
实时 12:26:25
English(EN) MEnvAgent: Scalable Polyglot Environment Construction for Verifiable Software Engineering

新框架自动化AI软件工程环境创建

研究人员开发了MEnvAgent,一个旨在自动化跨多种编程语言的可执行软件工程环境创建的框架。该系统通过采用规划-执行-验证架构和环境重用机制来降低计算成本,解决了可验证数据集稀缺的问题,以训练AI代理。在MEnvBench基准上的评估显示,MEnvAgent将任务完成率提高了8.6%,将时间成本降低了43%,并实现了可验证Docker环境的最大开源多语言数据集的创建。 AI

影响 能够为软件工程中的AI代理训练创建更大、更真实的训练数据集,有可能提高其在各种编程语言中的能力。

排序理由 关于AI在软件工程领域的新框架和基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Chuanzhe Guo, Jingjing Wu, Sijun He, Yang Chen, Zhaoqi Kuang, Shilong Fan, Bingjin Chen, Siqi Bao, Jing Liu, Hua Wu, Qingfu Zhu, Wanxiang Che, Haifeng Wang ·

    MEnvAgent:可验证软件工程的可扩展多语言环境构建

    arXiv:2601.22859v3 Announce Type: replace-cross Abstract: The evolution of Large Language Model (LLM) agents for software engineering (SWE) is constrained by the scarcity of verifiable datasets, a bottleneck stemming from the complexity of constructing executable environments acr…