PulseAugur
实时 10:59:31
English(EN) Natural Identifiers for Privacy and Data Audits in Large Language Models

新方法使用自然标识符进行LLM隐私审计

一篇新的研究论文介绍了一种名为“自然标识符”(NIDs)的方法,用于改进大型语言模型的隐私和数据审计。目前审计差分隐私的方法通常需要重新训练模型或访问特定的保留数据集,而这对于已经训练好的模型来说是不切实际的。NIDs,如密码学哈希和常见训练数据中的短链接等结构化随机字符串,可用于为审计和保留数据集生成无限的替代“金丝雀”和保留数据,以进行数据集推断。这种方法可以在不重新训练的情况下进行事后差分隐私审计,并且即使没有私有的非成员保留数据集也能进行数据集推断。 AI

影响 这项研究可以为现有的LLM实现更实用、可扩展的隐私审计,从而可能增加信任和采用率。

排序理由 该集群包含一篇详细介绍LLM隐私新研究方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新方法使用自然标识符进行LLM隐私审计

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Lorenzo Rossi, Bart{\l}omiej Marek, Franziska Boenisch, Adam Dziedzic ·

    大型语言模型的自然标识符用于隐私和数据审计

    arXiv:2606.24408v1 Announce Type: new Abstract: Assessing the privacy of large language models (LLMs) presents significant challenges. In particular, most existing methods for auditing differential privacy require the insertion of specially crafted canary data during training, ma…

  2. arXiv cs.LG TIER_1 English(EN) · Adam Dziedzic ·

    大型语言模型的自然标识符用于隐私和数据审计

    Assessing the privacy of large language models (LLMs) presents significant challenges. In particular, most existing methods for auditing differential privacy require the insertion of specially crafted canary data during training, making them impractical for auditing already-train…