PulseAugur
实时 14:35:01
English(EN) Advancing the State-of-the-Art in Empirical Privacy Auditing

新方法使用合成金丝雀示例审计大型语言模型隐私风险

研究人员开发了一种新的实证方法,用于审计微调大型语言模型相关的隐私风险。该技术涉及使用大型语言模型的高温采样生成合成“金丝雀”示例,然后将其与敏感训练数据混合,以识别潜在的数据泄露。这种方法还可以审计从微调模型生成合成数据的隐私影响。 AI

影响 引入了一种评估和缓解大型语言模型微调和合成数据生成中隐私风险的新技术。

排序理由 该集群包含一篇详细介绍隐私审计新方法的学术论文。

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv stat.ML TIER_1 English(EN) · Nicole Mitchell, Galen Andrew, Arun Ganesh, Brendan McMahan, Peter Kairouz ·

    Advancing the State-of-the-Art in Empirical Privacy Auditing

    arXiv:2606.10481v1 Announce Type: cross Abstract: Parameter-efficient fine-tuning of large language models (LLMs) can exhibit problematic memorization of individual training examples. Empirical privacy auditing (EPA) quantifies this risk by measuring realistic data leakage on mem…

  2. arXiv stat.ML TIER_1 English(EN) · Peter Kairouz ·

    推进经验性隐私审计的最新技术水平

    Parameter-efficient fine-tuning of large language models (LLMs) can exhibit problematic memorization of individual training examples. Empirical privacy auditing (EPA) quantifies this risk by measuring realistic data leakage on membership inference (MI) or reconstruction attacks. …