PulseAugur
实时 22:54:15
实体 Bartocci et al.

Bartocci et al.

PulseAugur coverage of Bartocci et al. — every cluster mentioning Bartocci et al. across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_08542 ·

    新基准评估LLM根据需求生成API测试用例的有效性

    研究人员推出了RESTestBench,一个旨在评估大型语言模型(LLM)根据自然语言需求为REST API生成测试用例的有效性的新基准。传统的指标不足以评估这些LLM生成的旨在验证功能行为的测试。RESTestBench包含三个具有精确和模糊需求变体的REST服务,以及一种新颖的变异测试指标,用于评估针对特定需求的故障检测能力。