PulseAugur
实时 14:07:26
实体 LlamaGuard-2

LlamaGuard-2

PulseAugur coverage of LlamaGuard-2 — every cluster mentioning LlamaGuard-2 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_15473 ·

    Sentra-Guard 系统针对对抗性 LLM 提示实现了 99.96% 的检测率

    研究人员开发了 Sentra-Guard,一个旨在防御针对大型语言模型(LLM)的对抗性提示的实时系统。该系统采用混合方法,结合语义嵌入和 Transformer 分类器来识别和中和越狱和提示注入攻击。Sentra-Guard 通过翻译非英语提示进行评估,展现了多语言弹性,并包含一个人工反馈机制以实现持续学习。