研究人员开发了一种新颖的基于LLM的管道,可自主地将庞大的PubMed语料库转化为结构化的生物医学数据集。该系统名为Starling,可以处理数百万篇研究论文以提取细致的信息,创建比现有精选存储库更大、更准确的数据集。该系统在六项不同的生物医学任务中展示了其能力,生成了数百万条记录,错误率远低于传统数据库,并包含支持性段落,捕捉了表格格式中经常丢失的实验背景。 AI
影响 该系统可以通过大规模提供更准确、更全面的生物医学数据来加速治疗设计。
排序理由 该集群描述了一篇研究论文,详细介绍了一个新的基于LLM的生物医学数据提取和数据集创建系统。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →