研究人员开发了一种名为SemiPrune的新方法,用于高效剪枝深度学习中使用的大型数据集。该技术解决了现有方法需要完全标记数据这一限制,而标记数据通常成本高昂。SemiPrune利用少量标记数据结合半监督学习为未标记数据生成伪标签,从而能够应用监督剪枝方法。该方法从这些伪标签导出的训练动态中估计样本难度,从而实现更准确的核集选择,并在各种专业数据集上取得最先进的性能。 AI
影响 为深度学习训练准备大型数据集提供了一种更具成本效益的方式,通过减少计算和存储需求,有可能加速研究和开发。
排序理由 这是一篇详细介绍新的数据集剪枝方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →