本文介绍了一个新颖的理论框架,用于理解使用恒定学习率的随机梯度下降(SGD)进行分位数估计。作者将 SGD 迭代视为一个马尔可夫链,证明了它无论初始化如何都能收敛到平稳分布。他们证明了分位数 SGD 估计器的中心极限定理,为该方法在非光滑和非强凸设置下提供了第一个理论保证。此外,还提出了一种用于构建置信区间的递归算法,并通过数值研究验证了该方法。 AI
影响 为 SGD 中的分位数估计提供了基础理论保证,有可能在非标准设置下提高机器学习模型的可靠性。
排序理由 学术论文,提出了机器学习算法的新理论保证。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →