研究人员发现,Token 概率的排序,而不仅仅是概率本身,可以作为语言模型的独特且不可伪造的签名。这种排序签名在计算上难以复制,使其成为识别特定模型的潜在方法。研究还表明,API 可以通过将输出限制在少数 top-k Token 来暴露这种不可伪造的签名,而不会泄露敏感的模型参数。 AI
影响 引入了一种新的模型识别方法,可以增强 AI 系统的安全性和来源追踪。
排序理由 该集群包含一篇详细介绍语言模型识别新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →