研究人员开发了一个名为受控行为分歧(CBD)的新框架,以解决从仅通过API访问的大型语言模型(LLM)中遗忘数据的挑战。CBD使用辅助模型在保留数据和目标数据之间创建分歧,将其转换为遗忘分数,以将不需要的提示从LLM中路由出去。该方法旨在在有效移除敏感或过时信息的同时,保持模型的效用,即使目标数据和保留数据具有相似的结构。 AI
影响 这项研究可以实现更有效和注重隐私的更新LLM的方法,而无需完全重新训练,尤其是在仅API的场景下。
排序理由 该集群包含一篇详细介绍LLM中机器学习遗忘新方法的学术论文。
- arXiv
- CBD
- Hugging Face
- Massive Multitask Language Understanding
- TOFU forget10
- WMDP
- large language models
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →