None Label-Efficient Dataset Pruning via Semi-Supervised Pseudo-Labeling

新的SemiPrune方法以最少的标记数据剪枝数据集

作者 PulseAugur 编辑部 · [1 source] · 2026-05-25 04:00

研究人员开发了一种名为SemiPrune的新方法，用于高效剪枝深度学习中使用的大型数据集。该技术解决了现有方法需要完全标记数据这一限制，而标记数据通常成本高昂。SemiPrune利用少量标记数据结合半监督学习为未标记数据生成伪标签，从而能够应用监督剪枝方法。该方法从这些伪标签导出的训练动态中估计样本难度，从而实现更准确的核集选择，并在各种专业数据集上取得最先进的性能。 AI

影响为深度学习训练准备大型数据集提供了一种更具成本效益的方式，通过减少计算和存储需求，有可能加速研究和开发。

排序理由这是一篇详细介绍新的数据集剪枝方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 · Yeseul Cho, Baekrok Shin, Changmin Kang, Chulhee Yun · 2026-05-25 04:00

Label-Efficient Dataset Pruning via Semi-Supervised Pseudo-Labeling

arXiv:2605.23198v1 Announce Type: new Abstract: Dataset pruning reduces the storage and training costs of deep learning by selecting an informative subset from a large dataset. However, most existing pruning methods require fully labeled data, which limits their applicability in …

报道来源 [1]

Label-Efficient Dataset Pruning via Semi-Supervised Pseudo-Labeling

相关实体

相关话题