研究人员发现,用于治疗效果估计的机器学习模型在学术研究和工业实践中的评估方式存在显著脱节。一项新研究表明,在方法学工作中使用的、依赖于反事实结果的指标,与在实际应用中使用的可观察指标并不一致。此外,在标准的半模拟基准测试上的性能排名并不能可靠地迁移到真实数据集上,这表明未来研究需要纳入可观察指标和真实数据验证。 AI
影响 突出了评估治疗效果估计AI模型的一个关键差距,这可能会影响真实应用开发和验证的方式。
排序理由 关于治疗效果估计新评估方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →