一篇新的研究论文强调了使用机器学习模型进行白血病检测的现有基准中存在严重的数据泄漏问题。该研究建立了一个更严格的主题不重叠评估协议,揭示了先前接近完美的性能指标由于同一患者的细胞同时出现在训练集和测试集中而被夸大。在此更严格的协议下,EfficientNet-B1 成为表现最佳的模型,尽管其结果仍强调了在医学图像分析中仔细验证的必要性。 AI
影响 强调了医疗 AI 基准中的关键数据泄漏问题,为可靠的临床应用需要更严格的验证。
排序理由 学术论文,详细介绍了机器学习模型的新基准和评估方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →