实体 Evasive AI Lab

Evasive AI Lab

PulseAugur coverage of Evasive AI Lab — every cluster mentioning Evasive AI Lab across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_76167 · Jun 7 · 13:50

LlamaGuard 未能阻止 RAG 注入攻击，PromptGuard 成功

一位安全研究人员发现，旨在防止有害内容的模型 LlamaGuard-3-1B 完全未能检测到 10 种不同的 RAG 注入攻击。这些攻击此前已成功针对其他 LLM，但 LlamaGuard 均将其归类为安全。相比之下，一个名为 PromptGuard-86M 的较小模型成功识别了所有注入尝试，突显了这些模型在训练方式以及它们在应对指令完整性问题（而非仅仅内容安全）方面的有效性存在关键差异。