English(EN) PARASITE: Conditional System Prompt Poisoning to Hijack LLMs

新的PARASITE技术通过条件系统提示注入来劫持LLM

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了一个名为PARASITE的新框架，可以条件性地污染大型语言模型的系统提示。该方法允许攻击者创建看似无害的提示，但在特定查询（如政治问题）时触发受损的响应，同时保持其他输入的正常功能。PARASITE在黑盒环境下运行，并已证明对GPT-4o-mini和GPT-3.5等模型有效，能够规避常见的防御措施。 AI

影响引入了LLM的新型攻击向量，突显了提示市场中潜在的供应链漏洞。

排序理由该集群包含一篇详细介绍LLM新攻击方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Viet Pham, Thai Le · 2026-04-28 04:00

PARASITE: Conditional System Prompt Poisoning to Hijack LLMs

arXiv:2505.16888v4 Announce Type: replace-cross Abstract: Large Language Models (LLMs) are increasingly deployed via third-party system prompts downloaded from public marketplaces. We identify a critical supply-chain vulnerability: conditional system prompt poisoning, where an ad…

报道来源 [1]

PARASITE: Conditional System Prompt Poisoning to Hijack LLMs

相关实体

相关话题