研究人员开发了一个新的框架来审计由AI模型生成的合成数据,旨在检测和解释训练数据中的私有信息可能泄露的实例。该方法区分了用户数据的直接复制和类似数据的偶然生成,并使用统计检验与差分隐私等隐私基准进行比较。这种方法不依赖于特定模型,不需要访问模型本身,并且计算量比以前的方法更少。 AI
影响 该框架可以提高合成数据的可信度,从而在隐私敏感的应用中更安全地使用AI模型。
排序理由 该集群包含一篇在arXiv上发表的研究论文,详细介绍了审计合成数据的新框架。
- arXiv
- differential privacy
- generative artificial intelligence
- large-language models
- Membership inference attack
- synthetic data
- alphaXiv
- CatalyzeX
- DagsHub
- Gotit.pub
- Hugging Face
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →