English(EN) BatteryPass-12K: The First Dataset for the Novel Digital Battery Passport Conformance Task

GPT-5.4 在新的欧盟数字电池护照合规性任务中引领大型语言模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-01 04:00

研究人员推出了 BatteryPass-12K，这是首个用于对数字电池护照合规性进行分类的数据集，以应对欧盟即将出台的电池法规。他们评估了 22 种语言模型，发现 GPT-5.4 在零样本推理方面取得了最佳性能。研究还表明，少样本示例能显著提高性能，并且模型参数的扩展并不总是能保证更好的结果，因为一些较小的模型表现优于较大的模型。研究发现，提示注入攻击会降低模型在此任务上的性能。 AI

影响新的数据集和模型评估可能为电池行业的监管合规性人工智能开发提供信息。

排序理由学术论文，介绍了一个新数据集并在新任务上评估了语言模型。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Tosin Adewumi, Martin Karlsson, Lama Alkhaled, Marcus Liwicki · 2026-05-01 04:00

BatteryPass-12K: The First Dataset for the Novel Digital Battery Passport Conformance Task

arXiv:2604.26986v1 Announce Type: new Abstract: We introduce a novel task of digital battery passport (DBP) conformance classification and introduce the first public benchmark for the task: BatteryPass-12K, created synthetically from real pilot samples. This is as the EU's batter…

报道来源 [1]

BatteryPass-12K: The First Dataset for the Novel Digital Battery Passport Conformance Task

相关实体

相关话题