研究人员开发了一个 Autonomous QA Agent,这是一个检索增强生成 (RAG) 系统,旨在提高自动化软件测试脚本的可靠性。该系统将 Selenium 脚本生成与项目特定文档和 HTML 结构相结合,解决了 LLM 幻觉出不存在的 UI 元素的问题。评估表明,与标准的 LLM 生成相比,语法有效性和执行成功率有了显著提高,凸显了 RAG 在自动化 UI 测试中的潜力。 AI
影响 通过 RAG 减少 LLM 幻觉,提高自动化 UI 测试的可靠性。
排序理由 关于自动化软件测试新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →