一篇分析用于临床疾病分类的多模态AI模型的新研究论文揭示了其在校准和选择性预测方面存在严重问题。研究发现,这些模型经常校准不当,将高不确定性分配给正确预测,将低不确定性分配给错误预测,尤其是在代表性不足的疾病上。这种故障模式会降低性能并误导人类专家,凸显了在临床AI中进行关注校准的评估以确保安全性和鲁棒性的必要性。 AI
影响 凸显了医疗保健领域AI的关键安全问题,表明标准指标可能掩盖真实临床环境中危险的故障。
排序理由 该集群包含一篇详细介绍AI模型行为实证分析的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →