PulseAugur
实时 20:30:08
None Label-Efficient Dataset Pruning via Semi-Supervised Pseudo-Labeling

新的SemiPrune方法以最少的标记数据剪枝数据集

研究人员开发了一种名为SemiPrune的新方法,用于高效剪枝深度学习中使用的大型数据集。该技术解决了现有方法需要完全标记数据这一限制,而标记数据通常成本高昂。SemiPrune利用少量标记数据结合半监督学习为未标记数据生成伪标签,从而能够应用监督剪枝方法。该方法从这些伪标签导出的训练动态中估计样本难度,从而实现更准确的核集选择,并在各种专业数据集上取得最先进的性能。 AI

影响 为深度学习训练准备大型数据集提供了一种更具成本效益的方式,通过减少计算和存储需求,有可能加速研究和开发。

排序理由 这是一篇详细介绍新的数据集剪枝方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 · Yeseul Cho, Baekrok Shin, Changmin Kang, Chulhee Yun ·

    Label-Efficient Dataset Pruning via Semi-Supervised Pseudo-Labeling

    arXiv:2605.23198v1 Announce Type: new Abstract: Dataset pruning reduces the storage and training costs of deep learning by selecting an informative subset from a large dataset. However, most existing pruning methods require fully labeled data, which limits their applicability in …