English(EN) Finetuning Activates Verbatim Recall of Copyrighted Books in LLMs https://github.com/cauchy221/Alignment-Whack-a-Mole-Code # HackerNews # Tech # AI

微调大型语言模型存在逐字回忆受版权保护书籍的风险；Liquid AI 发布可在边缘部署的 24B MoE 模型

作者 PulseAugur 编辑部 · [3 个来源] · 2026-04-30 03:11

一项新的研究论文和配套代码库揭示，微调大型语言模型可能会无意中导致对受版权保护材料的逐字回忆。该研究题为“Alignment Whack-a-Mole”，展示了在特定文本上训练的模型如何能够逐字重现这些文本的大部分内容。研究人员提供了一个用于预处理书籍、使用 OpenAI、Google (Gemini) 和 DeepSeek (Tinker) 的 API 微调模型以及评估记忆能力的流程。 AI

影响微调大型语言模型可能会无意中泄露受版权保护的材料，因此需要仔细的数据整理和评估。

排序理由该集群描述了一篇研究论文及相关的代码发布，详细介绍了大型语言模型行为的一项新发现。

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 3 个来源。我们如何撰写摘要 →

报道来源 [3]

Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] · 2026-04-30 05:37

对齐“打地鼠”：微调激活大型语言模型中版权书籍的逐字回忆 https://arxiv.org/abs/2603.20957 # ai

Alignment Whack-a-Mole: Finetuning Activates Verbatim Recall of Copyrighted Books in Large Language Models https:// arxiv.org/abs/2603.20957 # ai

链接 arxiv.org/…/2603.20957
Mastodon — mastodon.social TIER_1 English(EN) · [email protected] · 2026-04-30 03:15

LFM2-24B-A2B：扩展 LFM2 架构 https://www.liquid.ai/blog/lfm2-24b-a2b # HackerNews # Tech # AI

LFM2-24B-A2B: Scaling Up the LFM2 Architecture https://www.liquid.ai/blog/lfm2-24b-a2b # HackerNews # Tech # AI

链接 liquid.ai/…/lfm2-24b-a2b
Mastodon — mastodon.social TIER_1 English(EN) · [email protected] · 2026-04-30 03:11

微调使大型语言模型能够逐字回忆受版权保护的书籍 https://github.com/cauchy221/Alignment-Whack-a-Mole-Code # HackerNews # Tech # AI

Finetuning Activates Verbatim Recall of Copyrighted Books in LLMs https://github.com/cauchy221/Alignment-Whack-a-Mole-Code # HackerNews # Tech # AI

链接 github.com/…/Alignment-Whack-a-Mole-Code

报道来源 [3]

对齐“打地鼠”：微调激活大型语言模型中版权书籍的逐字回忆 https://arxiv.org/abs/2603.20957 # ai

LFM2-24B-A2B：扩展 LFM2 架构 https://www.liquid.ai/blog/lfm2-24b-a2b # HackerNews # Tech # AI

微调使大型语言模型能够逐字回忆受版权保护的书籍 https://github.com/cauchy221/Alignment-Whack-a-Mole-Code # HackerNews # Tech # AI

相关实体

相关话题