PulseAugur
实时 15:31:58
实体 BatteryPass-12K

BatteryPass-12K

PulseAugur coverage of BatteryPass-12K — every cluster mentioning BatteryPass-12K across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_11817 ·

    GPT-5.4 在新的欧盟数字电池护照合规性任务中引领大型语言模型

    研究人员推出了 BatteryPass-12K,这是首个用于对数字电池护照合规性进行分类的数据集,以应对欧盟即将出台的电池法规。他们评估了 22 种语言模型,发现 GPT-5.4 在零样本推理方面取得了最佳性能。研究还表明,少样本示例能显著提高性能,并且模型参数的扩展并不总是能保证更好的结果,因为一些较小的模型表现优于较大的模型。研究发现,提示注入攻击会降低模型在此任务上的性能。