实体 PPO-LLM

PPO-LLM

PulseAugur coverage of PPO-LLM — every cluster mentioning PPO-LLM across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_16149 · May 5 · 04:00

AI代理利用强化学习增强软件测试用例生成和代码覆盖率

研究人员开发了两种使用大型语言模型（LLMs）和强化学习进行自动化测试用例生成的新方法。第一种方法PPO-LLM采用近端策略优化（PPO）来指导LLM的提示选择，旨在最大化代码覆盖率并最小化源代码长度。第二种方法FeedbackLLM使用具有专门反馈代理的多代理系统，根据行和分支执行元数据来优化测试用例，并包含一个冗余预防缓存。这两种方法在为复杂软件系统生成测试用例方面均显示出优于现有工具的性能。