研究人员开发了一个名为Mastermind的新框架,以提高AI代理在复杂软件工程任务(特别是漏洞复现)中的性能。该框架将可迁移策略的学习与特定任务的执行分离开来,允许一个可训练的规划器通过监督微调和强化学习来优化可重用策略。在测试GPT-5.5、GPT-5.4和GLM-5.1等模型时,Mastermind显著提高了它们识别和复现软件漏洞的成功率。 AI
影响 增强了AI代理在复杂软件工程任务中的能力,有望改进网络安全和代码分析。
排序理由 该集群包含一篇研究论文,详细介绍了AI代理在软件工程中的新框架和方法论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →