一项新的研究论文和配套代码库揭示,微调大型语言模型可能会无意中导致对受版权保护材料的逐字回忆。该研究题为“Alignment Whack-a-Mole”,展示了在特定文本上训练的模型如何能够逐字重现这些文本的大部分内容。研究人员提供了一个用于预处理书籍、使用 OpenAI、Google (Gemini) 和 DeepSeek (Tinker) 的 API 微调模型以及评估记忆能力的流程。 AI
影响 微调大型语言模型可能会无意中泄露受版权保护的材料,因此需要仔细的数据整理和评估。
排序理由 该集群描述了一篇研究论文及相关的代码发布,详细介绍了大型语言模型行为的一项新发现。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →