PulseAugur
实时 16:23:24
English(EN) Curation and Extraction of Drug-Related Entities from Reddit Platform

新数据集从Reddit提取药物洞察

研究人员开发了ReDose,一个包含6,435个关于物质使用的Reddit帖子的数据集,以帮助医生更好地了解临床过量病例之外的真实世界药物使用情况。该数据集由一位毒理学家和医学生标注,包含DRUG、DOSE和EFFECT等实体。在对各种模型进行基准测试时,BiomedBERT在DRUG实体提取方面表现强劲,而Llama-3 70B在整体提取方面优于GPT-4。该研究强调了从用户生成内容中准确提取EFFECT实体的持续挑战。 AI

影响 增强了LLM从社交媒体中提取专业医疗数据的能力,可能提高药物安全性与理解。

排序理由 该集群包含一篇学术论文,详细介绍了医学领域实体提取的新数据集和基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新数据集从Reddit提取药物洞察

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Zewei Wang, Zihan Xu, Yishu Wei, Michael Chary, Yifan Peng ·

    从Reddit平台提取和策展药物相关实体

    arXiv:2605.26445v1 Announce Type: new Abstract: Physicians learn primarily about illicit drugs from clinical overdose cases, limiting their understanding of real-world usage. Meanwhile, drug users share first-hand experiences online, offering insights into dosage and effects of d…