研究人员推出了 RenoBench,这是一个新的公共基准数据集,用于评估引文解析系统。该数据集来源于四大主要出版生态系统,包含跨越多种语言和出版类型的 10,000 条已标注引文。初步评估表明,语言模型(尤其是经过微调的模型)在此任务上表现强劲,为自动化引文解析和科学计量学中更标准化和可复现的研究铺平了道路。 AI
影响 为评估和推进引文解析技术提供了一个标准化基准,这对于元科学研究至关重要。
排序理由 该集群描述了一篇介绍特定 NLP 任务基准数据集的新学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →