研究人员开发了一种新颖的方法,通过分析其注意力参数矩阵的标准差分布来识别大型语言模型(LLM)的指纹。该技术创建了一个独特的签名,即使在大量继续训练后也能保持稳定,从而能够可靠地识别模型的来源并检测版权侵权。研究发现的证据表明,华为的 Pangu Pro MoE 模型可能通过升级再造(upcycling)源自 Qwen-2.5 14B,这表明可能存在模型抄袭。 AI
影响 提供了一种新的方法来验证模型来源并打击 LLM 开发中的知识产权盗窃。
排序理由 学术论文,介绍了一种用于 LLM 指纹识别和检测潜在抄袭的新方法。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →