PulseAugur
实时 08:23:58
English(EN) Debugging the Debuggers: Failure-Anchored Structured Recovery for Software Engineering Agents

新框架PROBE改进了软件故障后AI代理的恢复能力

研究人员开发了PROBE,一个旨在改进软件工程代理在故障后恢复过程的新框架。PROBE将故障运行的遥测数据结构化为证据、诊断和后续尝试的可操作指导。在评估中,PROBE在未解决的案例中表现出65.37%的诊断准确率和21.79%的恢复率,显著优于现有方法。与Microsoft的IcM系统集成的原型显示,PROBE可以在不改变代理策略或工具的情况下增强现有工作流程。 AI

影响 提高了AI代理在复杂软件工程任务中的可靠性,可能减少人工干预。

排序理由 该集群包含一篇详细介绍AI代理新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Chenyu Zhao, Shenglin Zhang, Yihang Lin, Wenwei Gu, Zhimin Chen, Yongqian Sun, Dan Pei, Chetan Bansal, Saravan Rajmohan, Minghua Ma ·

    调试调试器:基于失败的结构化恢复用于软件工程代理

    arXiv:2605.08717v2 Announce Type: replace-cross Abstract: Software engineering agents are increasingly deployed in evaluable engineering environments, yet post-failure recovery remains costly, manual, and ad hoc. Existing systems expose traces or generate follow-up feedback, but …