一项名为BenchX的新基准已被开发出来,用于评估用于癌症检测和定位的AI模型。该基准包含85,355张CT扫描图像,评估了12种AI模型在不同患者人口统计学和成像方案下的性能。研究结果表明,针对平均准确率优化的AI模型在代表性不足的亚组(如年轻、女性非洲裔美国人)上的表现往往不佳,这凸显了在医学AI中进行亚组级别评估的关键需求。 AI
影响 强调了在医学影像领域,尤其是在代表性不足的患者群体中,对更强大、更公平的AI模型的需求。
排序理由 该集群包含一篇详细介绍AI模型新基准的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →