实体 Bartocci et al.

Bartocci et al.

PulseAugur coverage of Bartocci et al. — every cluster mentioning Bartocci et al. across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_08542 · Apr 28 · 16:59

新基准评估LLM根据需求生成API测试用例的有效性

研究人员推出了RESTestBench，一个旨在评估大型语言模型（LLM）根据自然语言需求为REST API生成测试用例的有效性的新基准。传统的指标不足以评估这些LLM生成的旨在验证功能行为的测试。RESTestBench包含三个具有精确和模糊需求变体的REST服务，以及一种新颖的变异测试指标，用于评估针对特定需求的故障检测能力。