研究人员开发了自动分类无效 Bug 报告并生成无代码修复的方法,旨在减少客户支持中的资源浪费。他们在一个精心策划的基准数据集上,对 vanilla LLMs、检索增强生成 (RAG) 和 agentic web search 进行了实验。RAG 在子分类方面表现最佳,加权 F1 分数达到 0.66,而 agentic web search 在无代码修复生成方面领先,Judge LLM 成功率为 68.9%。 AI
影响 自动化 Bug 报告的分类和解决,可能节省大量的开发和支持资源。
排序理由 该集群包含一篇详细介绍新颖研究方法和实验结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →