PulseAugur
实时 11:28:25

Disjoint generative models enhance synthetic data privacy and utility

研究人员引入了一个新颖的框架,使用不相交的生成模型来创建合成表格数据集。该方法将数据划分为单独的子集,每个子集由不同的生成模型处理,然后通过不需要共同标识符的连接操作进行组合。该方法增强了隐私性,提高了计算可行性,并允许混合模型合成,在显著降低重新识别风险的同时,实现了具有竞争力的准确性和效用。 AI

影响 引入了一种生成合成数据的新方法,该方法提高了隐私性和效用,可能影响数据共享和模型训练。

排序理由 该集群包含一篇详细介绍合成数据生成新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Anton Danholt Lautrup, Muhammad Rajabinasab, Tobias Hyrup, Arthur Zimek, Peter Schneider-Kamp ·

    合成数据的分离生成

    arXiv:2507.19700v2 Announce Type: replace Abstract: We propose a new framework for generating tabular synthetic datasets via disjoint generative models. In this paradigm, a dataset is partitioned into disjoint subsets that are supplied to separate instances of generative models. …