一篇新发表在arXiv上的研究论文表明,当前用于诊断胸部X光的机器学习模型可能夸大了其在现实世界中的临床效用。该研究纳入了患者出院小结等临床背景信息,发现模型性能(以AUROC和其他指标衡量)在已有较高患病概率的患者身上显著下降。这表明这些模型在高风险患者群体中可能表现更差,突显了报告的平均性能与实际临床适用性之间的差距。 AI
影响 强调了AI诊断工具在真实临床环境中,尤其是在高风险患者方面,可能存在的性能高估问题。
排序理由 一篇发表在arXiv上的研究论文,详细介绍了一种用于评估ML模型的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
- alphaXiv
- Andrew H.-J. Wang
- arXiv
- CatalyzeX
- Chest X-Rays
- computer vision
- DagsHub
- Gotit.pub
- Hugging Face
- machine learning
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →