研究人员开发了一个基准来评估用于多标签胸部X光片分类的AI模型中的不确定性量化。该研究使用了MIMIC-CXR-JPG数据集,评估了卷积和Transformer架构的13种不同方法。研究结果强调,根据方法和模型架构的不同,在区分认知不确定性和偶然不确定性方面,效果和局限性各不相同。 AI
影响 为评估医疗诊断中AI模型的可靠性建立了一个基准,有可能提高诊断准确性和安全性。
排序理由 该集群包含一篇学术论文,详细介绍了用于医疗影像AI模型不确定性的新基准。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →