PulseAugur
实时 06:24:22
English(EN) Limited Reference, Reliable Generation: A Two-Component Framework for Tabular Data Generation in Low-Data Regimes

新框架增强了低数据量下的合成表格数据生成能力

研究人员开发了一个名为 ReFine 的新框架,以改进合成表格数据的生成,尤其是在数据量少的场景下。该方法解决了现有方法(如 GAN 和微调的 LLM)的局限性,这些方法通常需要大量参考数据,并可能产生分布漂移或冗余的输出。ReFine 利用嵌入到提示中的符号化 if-then 规则来指导生成,并采用双粒度过滤来减少过采样同时保留重要的稀有样本,在下游任务性能方面表现出显著的改进。 AI

影响 提高了合成数据在机器学习任务中的可靠性和实用性,尤其是在数据稀缺的领域。

排序理由 该集群包含一篇详细介绍表格数据生成新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新框架增强了低数据量下的合成表格数据生成能力

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Mingxuan Jiang, Keyang Chen, Yongxin Wang, Yongsheng Zhao, Ziyue Dai, Yicun Liu, Zeping Li, Qiuyang Zhang, Hongyi Nie, Hongbin Zhu, Sen Liu, Guangnan Ye, Hongfeng Chai ·

    有限参考、可靠生成:低数据量表格数据生成的两组件框架

    arXiv:2509.09960v2 Announce Type: replace-cross Abstract: Synthetic tabular data generation is increasingly essential in machine learning, supporting downstream applications when real-world, high-quality tabular data is insufficient. Existing tabular generation approaches, such a…