一款名为 resk-logits 的新开源工具已被开发出来,通过在 token 生成过程中拦截和抑制 logit 级别的有害输出,来增强 LLM 的安全性。这个 GPU 加速的 Aho-Corasick 引擎可以在一毫秒内处理超过 10,000 个模式,从而避免了传统后生成过滤器相关的 token 浪费和延迟峰值。该工具通过对将完成被禁止短语的 token 进行“影子封禁”来运行,为对抗越狱技术提供了一种更有效的方法。 AI
影响 通过在 logit 级别过滤有害内容,为 LLM 安全提供了一种更有效的方法,减少了延迟和 token 浪费。
排序理由 新的 LLM 安全开源工具发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →