本文对机器学习中的数据平衡策略进行了系统性回顾,涵盖了重采样和增强技术。它将方法从 SMOTE 等基础方法归类到先进的深度生成模型和集成策略。回顾强调,最佳方法的选择高度依赖于数据集特征和评估指标,并指出了未来的研究方向,例如将基础模型适应偏斜分布。 AI
影响 全面概述了用于改善模型在不平衡数据集上性能的技术,这对于许多实际应用至关重要。
排序理由 这是一篇发表在 arXiv 上的系统性综述论文。
- AMDO
- Balanced Random Forest
- GANs
- MWMOTE
- One-Sided Selection
- RUSBoost
- SMOTEBoost
- SMOTE-ENN
- SMOTE+OCSVM
- SMOTE-Tomek
- Tomek Links
- Diffusion Models
- NearMiss
- SMOTE
- Variational Autoencoders
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →