一篇新的研究论文介绍了一种名为“自然标识符”(NIDs)的方法,用于改进大型语言模型的隐私和数据审计。目前审计差分隐私的方法通常需要重新训练模型或访问特定的保留数据集,而这对于已经训练好的模型来说是不切实际的。NIDs,如密码学哈希和常见训练数据中的短链接等结构化随机字符串,可用于为审计和保留数据集生成无限的替代“金丝雀”和保留数据,以进行数据集推断。这种方法可以在不重新训练的情况下进行事后差分隐私审计,并且即使没有私有的非成员保留数据集也能进行数据集推断。 AI
影响 这项研究可以为现有的LLM实现更实用、可扩展的隐私审计,从而可能增加信任和采用率。
排序理由 该集群包含一篇详细介绍LLM隐私新研究方法的学术论文。
- cryptographic hashes
- dataset inference
- differential privacy
- Large Language Models
- Natural Identifiers
- shortened URLs
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →