研究人员推出“Structured PubMed”,一个包含来自PubMed的超过2320万篇生物医学摘要的大型数据集。该数据集旨在通过提供分段标记的摘要来改进信息检索和文本挖掘。它包括作者结构化的摘要以及使用大型语言模型管道自动标记的摘要,为训练分类模型和基准测试文本分割架构提供了宝贵的资源。 AI
影响 能够从生物医学文献中提取更精确的信息并进行知识综合。
排序理由 该集群包含一篇详细介绍新数据集的研究论文。
在 arXiv cs.IR (Information Retrieval) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →