PulseAugur
实时 06:03:50
English(EN) EDEN: A Large-Scale Corpus of Clinical Notes for Italian

新的意大利临床笔记语料库旨在促进医疗LLM的发展

研究人员推出了EDEN(Emergency Department Electronic Notes),这是一个意大利临床笔记的大规模语料库,旨在推进医疗应用中的大型语言模型。该数据集包含约400万份来自意大利医院急诊科的匿名笔记,其中6000份笔记经过临床专家细致的标注。这些标注涵盖了132项与患者情况相关的条目,如呼吸困难和意识丧失,为结构化信息提取任务提供了一个丰富但非平衡的资源。EDEN旨在成为最大的免费意大利临床笔记语料库,为CRF填充提供基准,并提供Gemma-27B和MedGemma-27B模型的基线结果。 AI

影响 提供了一个大规模的专业数据集,以提高LLM在意大利医疗环境中的性能。

排序理由 该集群描述了一篇介绍用于AI研究的数据集的新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Tiziano Labruna, Guido Bertolini, Pietro Ferrazzi, Bernardo Magnini ·

    EDEN: A Large-Scale Corpus of Clinical Notes for Italian

    arXiv:2606.12569v1 Announce Type: cross Abstract: We present EDEN (Emergency Department Electronic Notes), a new and unique large-scale corpus of clinical notes produced in Emergency Departments of Italian hospitals. The corpus, in its current version, is composed of approximatel…