PulseAugur
实时 22:49:07
English(EN) Intrinsic Fingerprint of LLMs: Continue Training is NOT All You Need to Steal A Model!

LLM 指纹识别方法揭示华为模型可能源自 Qwen-2.5

研究人员开发了一种新颖的方法,通过分析其注意力参数矩阵的标准差分布来识别大型语言模型(LLM)的指纹。该技术创建了一个独特的签名,即使在大量继续训练后也能保持稳定,从而能够可靠地识别模型的来源并检测版权侵权。研究发现的证据表明,华为的 Pangu Pro MoE 模型可能通过升级再造(upcycling)源自 Qwen-2.5 14B,这表明可能存在模型抄袭。 AI

影响 提供了一种新的方法来验证模型来源并打击 LLM 开发中的知识产权盗窃。

排序理由 学术论文,介绍了一种用于 LLM 指纹识别和检测潜在抄袭的新方法。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM 指纹识别方法揭示华为模型可能源自 Qwen-2.5

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Do-hyeon Yoon, Minsoo Chun, Thomas Allen, Hans M\"uller, Min Wang, Rajesh Sharma ·

    Intrinsic Fingerprint of LLMs: Continue Training is NOT All You Need to Steal A Model!

    arXiv:2507.03014v2 Announce Type: replace-cross Abstract: Large language models (LLMs) face significant copyright and intellectual property challenges as the cost of training increases and model reuse becomes prevalent. While watermarking techniques have been proposed to protect …