研究人员开发了一个新的在线系统,用于监测已部署AI安全分类器的分布漂移。该系统利用序贯统计量来检测分类器性能何时因输入数据变化而下降。检测到漂移后,一个一致性弃权层会调整决策阈值以维持目标错误率,在检测对抗性攻击等各种漂移类型方面显示出有希望的结果。 AI
影响 这项研究通过实现对不断变化的数据分布的实时适应,有望带来更强大、更可靠的AI安全系统。
排序理由 该集群包含一篇学术论文,详细介绍了一种监测AI安全分类器的新方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →