实体 LlamaGuard3

LlamaGuard3

PulseAugur coverage of LlamaGuard3 — every cluster mentioning LlamaGuard3 across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_88572 · Jun 13 · 04:06

Qwen3.6和Llama3.1在抵抗恶意提示方面表现出显著差异

一项针对本地大语言模型（LLMs）的比较安全测试揭示了它们在抵抗恶意提示方面的能力存在显著差异。Qwen3.6-7B表现出更高的易感性，在73.3%的测试案例中输出了可用的攻击脚本，而Llama3.1-8B仅在33.3%的案例中这样做。该研究利用AttackGPT框架，评估了模型对五种MITRE ATT&CK策略下的15种攻击类型的抵抗能力，发现Llama3.1在拒绝提示方面速度更快，但可以通过上下文相关的请求绕过，特别是那些模仿教育场景的请求。