研究人员开发了一个新的AI框架,用于追踪和分类学术文献中的数据集使用情况,填补了当前研究基础设施的空白。该多任务GLiNER系统联合提取数据集提及、识别关系并对使用上下文进行分类。为了克服标记数据有限的挑战,该方法结合了合成数据生成和基于LLM的再验证,以提高监测数据集引用的准确性和一致性。 AI
影响 通过更好地追踪数据集引用,提高了研究的透明度和可复现性。
排序理由 该集群包含一篇学术论文,详细介绍了监测研究文献中数据集使用情况的新方法和框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →