实体 RealToxicityPrompts

RealToxicityPrompts

PulseAugur coverage of RealToxicityPrompts — every cluster mentioning RealToxicityPrompts across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

安全 1
论文 1
模型发布 1

情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_58669 · May 29 · 04:00

开源安全防护模型接受评估；较小的 Qwen Guard 在召回率方面领先

一项新的研究论文使用包含八个安全类别、超过 79,000 个样本的基准来评估 14 个开源安全防护模型。研究发现，模型大小与安全检测性能不相关，令人惊讶的是，一个较小的模型 Qwen Guard（40亿参数）实现了 83.97% 的最高召回率。Llama Guard 和 GPT-OSS Safeguard 等较大模型错过了大量不安全内容，凸显了召回率作为安全应用的关键指标。

开源安全防护模型接受评估；较小的 Qwen Guard 在召回率方面领先