研究人员推出AutoSpecNER,一个专为车辆广告细粒度命名实体识别设计的新数据集。该数据集包含659个广告,标注了超过10,000个实体,涵盖15个类别,包括型号和电池容量,实现了91.5%的标注者间一致性得分。通过对各种方法进行基准测试,DeBERTa模型表现最佳,取得了90%的微F1分数,显著优于基于规则的系统和其他大型语言模型。 AI
影响 该数据集有望提高汽车列表信息提取的准确性,使平台和消费者受益。
排序理由 该集群描述了一个新的学术数据集和特定NLP任务的基准测试结果。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →