研究人员发现,在3D医学图像分割的半监督学习中存在严重的过度自信问题。他们认为,当前的方法常常将预测置信度与真实不确定性混淆,导致确认偏差。此外,许多基准测试中缺乏专门的验证集,鼓励使用测试集进行验证,从而夸大了性能估计,并造成了过拟合的“军备竞赛”。为解决此问题,提出了一种新框架,该框架明确区分了置信度和不确定性,并纠正了不同数据空间中的偏差,提倡更严格的基准测试实践。 AI
影响 强调了医学影像AI能力可能被高估,呼吁进行更稳健的评估以确保可靠的临床应用。
排序理由 该集群包含一篇提出新方法论并批评现有研究实践的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →