大型语言模型中的提示注入是一个架构问题,而不仅仅是安全漏洞,因为系统在同一个上下文窗口内处理可信指令和不可信数据。传统的过滤方法不足以应对攻击者可以将恶意指令隐藏在网页或文档等外部内容中,而大型语言模型将其视为另一个令牌序列。解决提示注入问题需要从防御性提示转向根本性的架构设计,以建立更清晰的信任边界。 AI
影响 强调了当前大型语言模型架构在区分可信指令和不可信数据方面存在固有的困难,需要新的设计方法来实现强大的安全性。
排序理由 文章讨论了大型语言模型架构中的一个根本性安全挑战,将其作为一个研究课题来呈现,而不是产品发布或政策变更。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →