PulseAugur
实时 22:51:56

研究发现污染数据中的线性回归出现双重下降

研究人员调查了在训练数据被异常值污染的情况下,线性回归模型中出现的“双重下降”现象。他们的模拟研究将标准的最小二乘插值估计器与几种稳健的替代方法进行了比较。研究结果表明,即使在数据被污染的情况下,高度过参数化的模型仍然可以表现出双重下降,与稳健方法相比,具有更优的泛化性能。 AI

影响 这项研究探讨了带有噪声数据的过参数化模型的行为,可能为设计更稳健的机器学习系统提供信息。

排序理由 该集群包含一篇详细介绍机器学习现象模拟研究的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Tino Werner ·

    Double descent for least-squares interpolation on contaminated data: A simulation study

    arXiv:2605.21494v1 Announce Type: new Abstract: Overparametrized models can exhibit an excellent generalization performance, although they should be prone to overfitting according to classical statistical theory. The discovery of the "double descent", indicating that the generali…