Ordinary Least Squares
PulseAugur coverage of Ordinary Least Squares — every cluster mentioning Ordinary Least Squares across labs, papers, and developer communities, ranked by signal.
-
新理论揭示并纠正了机器学习中随机投影的偏差
研究人员开发了一个新的理论框架,以解决随机斜投影中的统计偏差问题,这是机器学习和数值线性代数中的常用技术。该研究强调了标准采样方法如何在子采样最小二乘法和快速低秩近似的解中引入隐藏偏差。提出的去偏框架旨在纠正这些偏差,为这些应用提供可证明的改进,并通过数值实验验证的快速CUR分解的准确性得到提高。
-
贝叶斯方法在预测和不确定性方面优于经典稀疏回归
一项新的基准研究评估了六种稀疏回归方法,将 Lasso 等经典方法与 Horseshoe 和 Spike-and-Slab 等贝叶斯技术进行了比较。研究发现,贝叶斯方法通常能提供更优的预测误差和更准确的不确定性估计,其中 Horseshoe 先验实现了接近名义的覆盖率。然而,在变量选择方面,Lasso 和 Spike-and-Slab 的表现相当,这表明当不需要完整的后验估计时,Lasso 仍然是一个实用的选择。
-
SHIFT估计器改进了重尾数据的鲁棒双重机器学习
研究人员开发了SHIFT,一种用于双重机器学习(DML)管道的新型鲁棒估计器,旨在处理重尾数据污染。SHIFT结合了交叉拟合干扰正交化、核局部Welsch损失第二阶段和防御性普通最小二乘法重新拟合。该方法在存在异常值的情况下显著提高了准确性,在压力测试中将均方根误差(RMSE)从1.03降低到0.33,并实现了异常值掩码恢复的高F1分数。
-
研究人员提出用于经济学中人工智能生成标签的新引导方法
Timothy Christensen 的一篇新论文提出了一种耦合标签引导方法,用于解决在经济回归中使用人工智能/机器学习生成的标签作为协变量时出现的普通最小二乘估计量中的偏差。研究强调,标准的固定标签引导方法通常无效,除非满足特定的独立性条件。提出的耦合标签引导方法联合重采样真实标签和推算标签,在不满足这些严格条件的情况下提供了更稳健的解决方案,并包含有限样本调整以提高准确性。这项工作通过模拟进行了说明,并应用于分析工资与远程工作状…