Dansk(DA) Token Rankings are Unforgeable Language Model Signatures

Token 排序被确定为不可伪造的语言模型签名

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-04 04:00

研究人员发现，Token 概率的排序，而不仅仅是概率本身，可以作为语言模型的独特且不可伪造的签名。这种排序签名在计算上难以复制，使其成为识别特定模型的潜在方法。研究还表明，API 可以通过将输出限制在少数 top-k Token 来暴露这种不可伪造的签名，而不会泄露敏感的模型参数。 AI

影响引入了一种新的模型识别方法，可以增强 AI 系统的安全性和来源追踪。

排序理由该集群包含一篇详细介绍语言模型识别新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 Dansk(DA) · Matthew Finlayson, Andreas Grivas, Xiang Ren, Swabha Swayamdipta · 2026-06-04 04:00

Token Rankings are Unforgeable Language Model Signatures

arXiv:2606.04459v1 Announce Type: cross Abstract: Language model parameters are known to impose unique (to each model) geometric constraints on their logit outputs, which serves as a signature that identifies the model, but also leaks the model's final layer parameters when an AP…