一篇新论文认为,临床文本数据集的构建方式显著影响自然语言处理(NLP)中自杀倾向检测的准确性和解释。研究强调,从电子健康记录(EHRs)构建的数据集,例如源自MIMIC-III的ScAN数据集,通常反映了临床医生的判断,并将自杀倾向操作化为一个有限的事件。这可能会掩盖原始临床表述中存在的时间性、否定性和不确定性的细微差别,导致对NLP模型输出的潜在误读。 AI
影响 强调了在临床NLP中仔细进行数据集策展和解释的关键需求,以确保准确和合乎道德的AI应用。
排序理由 该集群包含一篇讨论AI研究方法学的学术论文。
- International Statistical Classification of Diseases and Related Health Problems
- MIMIC-III
- ScAN dataset
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →