PulseAugur
实时 21:32:14
English(EN) Data Balancing Strategies: A Systematic Survey of Resampling and Augmentation Methods

数据平衡策略:重采样和增强方法的系统性调查

本文对机器学习中的数据平衡策略进行了系统性回顾,涵盖了重采样和增强技术。它将方法从 SMOTE 等基础方法归类到先进的深度生成模型和集成策略。回顾强调,最佳方法的选择高度依赖于数据集特征和评估指标,并指出了未来的研究方向,例如将基础模型适应偏斜分布。 AI

影响 全面概述了用于改善模型在不平衡数据集上性能的技术,这对于许多实际应用至关重要。

排序理由 这是一篇发表在 arXiv 上的系统性综述论文。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

数据平衡策略:重采样和增强方法的系统性调查

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Behnam Yousefimehr, Mehdi Ghatee, Javad Fazli, Shervin Ghaffari, Zahra Rafei, Mohammad Amin Seifi, Sajed Tavakoli, Abolfazl Nikahd, Mahdi Razi Gandomani, Alireza Orouji, Ramtin Mahmoudi Kashani, Sarina Heshmati, Negin Sadat Mousavi ·

    Data Balancing Strategies: A Systematic Survey of Resampling and Augmentation Methods

    arXiv:2505.13518v2 Announce Type: replace Abstract: Imbalanced datasets, where one class significantly outnumbers others, remain a persistent challenge in machine learning, often biasing predictions toward the majority class and degrading classifier performance. This paper provid…