PulseAugur
实时 13:43:39
English(EN) An adaptive subsampling method for large-sample feature screening

新的自适应子采样方法提高了特征筛选效率

研究人员开发了一种用于超高维数据集特征筛选的新型自适应子采样方法,旨在提高计算效率,优于标准的Sure Independence Screening (SIS)方法。这种受多臂老虎机问题启发的创新方法,通过逐步增加子样本大小并剔除不相关的特征,将计算成本从O(np)降低到O(sqrt(n)p)。该方法保留了“确定性筛选”特性,并在实验中展示了与SIS相当的筛选和预测性能,同时显著缩短了计算时间。 AI

影响 为大规模、高维数据集的特征筛选提供了一种更具计算效率的方法,可能有利于AI模型开发。

排序理由 详细介绍一种新统计方法的学术论文。[lever_c_demoted from research: ic=1 ai=0.7]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的自适应子采样方法提高了特征筛选效率

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Xiaxue Ouyang, Kejun He, Cheng Meng ·

    An adaptive subsampling method for large-sample feature screening

    arXiv:2509.16085v2 Announce Type: replace Abstract: We consider the sure independence screening (SIS) method, a standard feature screening approach that aims to eliminate non-informative features in ultrahigh-dimensional datasets. Although effective, SIS incurs a computational co…