PulseAugur
实时 03:03:16
English(EN) A Conditional GAN for Tabular Data Generation with Probabilistic Sampling of Latent Subspaces

新的GAN模型解决了表格数据中的类别不平衡问题

研究人员开发了ctdGAN,这是一种新颖的条件生成对抗网络,旨在解决表格数据集中的类别不平衡问题。该新模型将输入样本划分为簇,并采用概率采样策略在这些已识别的子空间内生成合成数据。该方法还结合了分簇缩放技术来捕获多个特征模式,以及一个在簇和类别级别上惩罚错误预测的损失函数。在14个不平衡数据集上的评估表明,ctdGAN在生成高保真样本和提高分类准确性方面是有效的。 AI

影响 这项研究为提高机器学习模型在不平衡表格数据集上的性能提供了一种新方法。

排序理由 该集群包含一篇研究论文,详细介绍了一种用于表格数据生成的新模型和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新的GAN模型解决了表格数据中的类别不平衡问题

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Leonidas Akritidis, Panayiotis Bozanis ·

    用于带潜在子空间概率采样的表格数据生成的条件GAN

    arXiv:2508.00472v2 Announce Type: replace Abstract: The tabular form constitutes the standard way of representing data in relational database systems and spreadsheets. But, similarly to other forms, tabular data suffers from class imbalance, a problem that causes serious performa…