研究人员推出Opir,这是一系列新的基于编码器的护栏模型,专为大型语言模型应用中的高效多任务安全分类而设计。Opir模型基于GLiClass架构构建,能够检测不安全提示、有毒语言、越狱尝试和有害内容,其部署占用的空间比大型护栏模型小得多。这些模型在全面的分类法上进行了训练,并与评估工具一起开源,以支持各种安全分类任务。 AI
影响 为LLM安全过滤提供了更高效、更小的模型,可能降低部署成本和延迟。
排序理由 该集群描述了一篇介绍用于安全分类的新型模型系列的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →