PulseAugur
实时 16:20:06
English(EN) AutoSpecNER: A Fine-Grained Named Entity Recognition Dataset for Vehicle Specification Extraction

新数据集AutoSpecNER旨在进行车辆规格提取

研究人员推出AutoSpecNER,一个专为车辆广告细粒度命名实体识别设计的新数据集。该数据集包含659个广告,标注了超过10,000个实体,涵盖15个类别,包括型号和电池容量,实现了91.5%的标注者间一致性得分。通过对各种方法进行基准测试,DeBERTa模型表现最佳,取得了90%的微F1分数,显著优于基于规则的系统和其他大型语言模型。 AI

影响 该数据集有望提高汽车列表信息提取的准确性,使平台和消费者受益。

排序理由 该集群描述了一个新的学术数据集和特定NLP任务的基准测试结果。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新数据集AutoSpecNER旨在进行车辆规格提取

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Jordan Lee, Filippos Ventirozos, Abdirahman Abdullahm, Ioanna Nteka, Peter Appleby, Matthew Shardlow ·

    AutoSpecNER:用于车辆规格提取的细粒度命名实体识别数据集

    arXiv:2606.24387v1 Announce Type: new Abstract: Vehicle advertisements contain rich specification information, but automotive NER resources remain limited. We introduce AutoSpecNER, an expert-annotated dataset for fine-grained entity recognition in vehicle listings. The dataset i…

  2. arXiv cs.CL TIER_1 English(EN) · Matthew Shardlow ·

    AutoSpecNER:用于车辆规格提取的细粒度命名实体识别数据集

    Vehicle advertisements contain rich specification information, but automotive NER resources remain limited. We introduce AutoSpecNER, an expert-annotated dataset for fine-grained entity recognition in vehicle listings. The dataset includes 659 advertisements from a popular car-se…