English(EN) Good Enough? An Investigation on the Impact of Label Quality in Large-Scale Medical Datasets

研究质疑预训练医学人工智能模型的严格标签质量

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

一篇新发表在arXiv上的研究调查了标签质量对用于训练分割模型的大规模医学数据集的影响。研究发现，虽然高质量标签对于直接用于部署的模型至关重要，但严格的标签质量对于预训练的有效性并非必需。这表明专家精力可能更好地分配给经过精心策划的下游数据集，而不是对海量预训练语料库进行详尽的人工干预式精炼。 AI

影响建议通过优先处理下游数据集而非详尽的预训练标签精炼来优化医学人工智能开发中的专家精力。

排序理由发表在arXiv上的研究论文，详细介绍了人工智能模型训练的发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Alexander Jaus, Zdravko Marinov, Constantin Seibold, Simon Rei{\ss}, Jiale Wei, Jens Kleesiek, Rainer Stiefelhagen · 2026-06-30 04:00

够用就好？一项关于大规模医学数据集标签质量影响的调查研究

arXiv:2505.20928v2 Announce Type: replace Abstract: Manually refining radiological segmentation masks is highly resource-intensive. To determine when this expert commitment is truly justified for the training of segmentation models, we investigate the relationship between label q…

报道来源 [1]

够用就好？一项关于大规模医学数据集标签质量影响的调查研究

相关实体

相关话题