PulseAugur
实时 16:32:44
实体 Evasive AI Lab

Evasive AI Lab

PulseAugur coverage of Evasive AI Lab — every cluster mentioning Evasive AI Lab across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_76167 ·

    LlamaGuard 未能阻止 RAG 注入攻击,PromptGuard 成功

    一位安全研究人员发现,旨在防止有害内容的模型 LlamaGuard-3-1B 完全未能检测到 10 种不同的 RAG 注入攻击。这些攻击此前已成功针对其他 LLM,但 LlamaGuard 均将其归类为安全。相比之下,一个名为 PromptGuard-86M 的较小模型成功识别了所有注入尝试,突显了这些模型在训练方式以及它们在应对指令完整性问题(而非仅仅内容安全)方面的有效性存在关键差异。