PulseAugur
实时 14:55:22
English(EN) Leak@$k$: Unlearning Does Not Make LLMs Forget Under Probabilistic Decoding

新指标揭示大型语言模型(LLMs)遗忘学习方法未能完全忘记敏感数据

一篇新的研究论文介绍了一种名为“Leak@k”的指标,旨在评估大型语言模型(LLMs)中遗忘学习方法的有效性。研究发现,大多数现有的遗忘技术未能完全删除敏感信息,因为通过概率解码仍然可以检索到这些信息。为解决此问题,该论文提出了一种名为“RULE”(Robust Unlearning under LEak@k metric)的新算法,该算法在防止基准数据集上的信息泄露方面表现出改进的性能。 AI

影响 当前大型语言模型(LLMs)的遗忘学习方法不足以实现稳健的数据删除,需要像RULE这样的新技术来确保隐私和合规性。

排序理由 学术论文,介绍了一种用于评估大型语言模型(LLMs)遗忘学习的新指标和算法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

新指标揭示大型语言模型(LLMs)遗忘学习方法未能完全忘记敏感数据

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Hadi Reisizadeh, Jiajun Ruan, Yiwei Chen, Soumyadeep Pal, Sijia Liu, Mingyi Hong ·

    Leak@$k$:在概率解码下,遗忘学习并不能让大型语言模型忘记

    arXiv:2511.04934v3 Announce Type: replace Abstract: Unlearning in large language models (LLMs) is critical for regulatory compliance and for building ethical generative AI systems that avoid producing private, toxic, illegal, or copyrighted content. Despite rapid progress, in thi…