研究人员推出了一种新颖的梯度提升方法 ITBoost,旨在增强模型在表格数据中对抗噪声标签的鲁棒性。与强调具有大梯度样本的传统方法不同,ITBoost 通过检查训练迭代过程中残差的演变来评估样本的可靠性。通过应用最小描述长度(Minimum Description Length)原理,ITBoost 会降低具有不规则残差模式的样本的权重,认为它们不太可信。该方法在理论上提供了在标签噪声下更紧密的泛化界限,并在噪声基准测试中实证证明了性能的提升,同时在干净数据上保持了优异的结果。 AI
影响 提高了梯度提升模型在噪声标签下的鲁棒性,有望在标签不完美的真实世界数据集上提升性能。
排序理由 这是一篇介绍机器学习新算法的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →