RESK Security 开发了两款新工具 resk-logits 和 reskSecure,旨在通过在 token 被采样之前干预 Logit 级别来增强大语言模型的安全性。这些工具旨在通过修改 token 概率来防止有害内容的生成,与传统的输出扫描方法相比,提供了一种主动的方法。这两款工具均可通过 Python Package Index 获取,并在 GitHub 上开源。 AI
影响 这些工具通过在生成前进行干预,提供了一种新颖的大语言模型安全方法,有可能提高安全性并降低有害输出的风险。
排序理由 该集群描述了用于大语言模型安全的新软件工具的发布。
- GitHub
- Python Package Index
- reskSecure
- Aho–Corasick algorithm
- graphics processing unit
- logit
- resk.fr
- resk-logits
- RESK Security Links
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →