一篇新的研究论文批判性地评估了数据集蒸馏(DD)方法,发现它们通常不如更简单的核心集选择(CS)策略,尤其是在ImageNet等大规模数据集上。该研究将七种最先进的DD方法与三种CS策略进行了基准测试,结果显示DD方法的计算成本可能更高,且实际优势有限。核心集还能更好地覆盖原始数据分布。 AI
影响 表明对于许多大规模机器学习任务,像核心集选择这样更简单、更有效的方法可能比数据集蒸馏更可取。
排序理由 该集群包含一篇在arXiv上发表的评估机器学习技术的论文。
- dataset distillation
- Hugging Face
- ImageNet100
- ImageNet-1K
- ImageNette
- arXiv
- data centric machine learning
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →