研究人员开发了一种用于超高维数据集特征筛选的新型自适应子采样方法,旨在提高计算效率,优于标准的Sure Independence Screening (SIS)方法。这种受多臂老虎机问题启发的创新方法,通过逐步增加子样本大小并剔除不相关的特征,将计算成本从O(np)降低到O(sqrt(n)p)。该方法保留了“确定性筛选”特性,并在实验中展示了与SIS相当的筛选和预测性能,同时显著缩短了计算时间。 AI
影响 为大规模、高维数据集的特征筛选提供了一种更具计算效率的方法,可能有利于AI模型开发。
排序理由 详细介绍一种新统计方法的学术论文。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →