研究人员推出了LCSHBench,这是一个用于评估自动化主题分类系统的新基准数据集,特别针对美国国会图书馆主题词(LCSH)。该数据集包含15种语言的22,346本书籍,来源于开放目录,并包括至少两个独立分类机构就LCSH分配达成一致的记录。LCSHBench同时考虑了精确的词条匹配和概念相似性,解决了图书馆之间主题一致性与精确词条表达之间常见的差异。初步实验表明,经过微调的嵌入器模型可以提高在此基准上的性能。 AI
影响 为执行主题分类的AI系统提供标准化评估,可能改善图书馆资源发现。
排序理由 该集群描述了一篇介绍AI研究基准数据集的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →