arXiv上发表的一项新研究探讨了用于肺癌诊断的深度学习模型的可解释性。虽然三种不同的模型(CNN、ResNet50和ViT)显示出高预测准确率,其中ResNet50达到98.61%的准确率,所有模型都达到0.99的ROC-AUC得分,但它们的推理过程却存在显著差异。研究人员使用LIME进行可解释性分析,发现模型对之间的解释相关性低于0.26,这表明模型关注的图像区域不同以得出预测结果。这表明仅凭预测一致性不足以验证临床AI系统,可解释性应作为一个独立的、关键的评估标准。 AI
影响 强调了临床AI中可解释性的关键需求,并指出当前高准确率模型可能因推理过程不同而不可靠。
排序理由 该集群包含一篇详细介绍AI模型可解释性研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →