研究人员开发了一个名为 ReFine 的新框架,以改进合成表格数据的生成,尤其是在数据量少的场景下。该方法解决了现有方法(如 GAN 和微调的 LLM)的局限性,这些方法通常需要大量参考数据,并可能产生分布漂移或冗余的输出。ReFine 利用嵌入到提示中的符号化 if-then 规则来指导生成,并采用双粒度过滤来减少过采样同时保留重要的稀有样本,在下游任务性能方面表现出显著的改进。 AI
影响 提高了合成数据在机器学习任务中的可靠性和实用性,尤其是在数据稀缺的领域。
排序理由 该集群包含一篇详细介绍表格数据生成新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →