English(EN) Intrinsic Fingerprint of LLMs: Continue Training is NOT All You Need to Steal A Model!

LLM 指纹识别方法揭示华为模型可能源自 Qwen-2.5

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-27 04:00

研究人员开发了一种新颖的方法，通过分析其注意力参数矩阵的标准差分布来识别大型语言模型（LLM）的指纹。该技术创建了一个独特的签名，即使在大量继续训练后也能保持稳定，从而能够可靠地识别模型的来源并检测版权侵权。研究发现的证据表明，华为的 Pangu Pro MoE 模型可能通过升级再造（upcycling）源自 Qwen-2.5 14B，这表明可能存在模型抄袭。 AI

影响提供了一种新的方法来验证模型来源并打击 LLM 开发中的知识产权盗窃。

排序理由学术论文，介绍了一种用于 LLM 指纹识别和检测潜在抄袭的新方法。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Do-hyeon Yoon, Minsoo Chun, Thomas Allen, Hans M\"uller, Min Wang, Rajesh Sharma · 2026-04-27 04:00

大语言模型的内在指纹：继续训练并非窃取模型的全部！

arXiv:2507.03014v2 Announce Type: replace-cross Abstract: Large language models (LLMs) face significant copyright and intellectual property challenges as the cost of training increases and model reuse becomes prevalent. While watermarking techniques have been proposed to protect …

报道来源 [1]

大语言模型的内在指纹：继续训练并非窃取模型的全部！

相关实体

相关话题