研究人员推出了一种新颖的框架SCOUT,旨在增强大型语言模型中的提示注入防御。SCOUT通过预测每个输入的各种检测器的可靠性和延迟来动态分配检测资源。这种自适应方法允许操作员使用单个阈值来平衡安全性和实用性,仅在必要时将请求路由到更强大(可能更慢)的LLM裁判。该框架在一个新基准SCOUT-450上展示了改进的性能,并有望转移到其他评估集。 AI
影响 通过动态管理提示注入检测来增强LLM安全性,可能降低计算成本并提高响应时间。
排序理由 该集群包含一篇详细介绍LLM安全新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →