研究人员开发了一种新的数据投毒技术,称为潜在类别攻击,它引入了一种新颖的、未知的类别数据,并将其错误标记为已知类别。这种攻击可能通过导致未知实体被归类为良性来绕过基于AI的安全系统。为了应对这种情况,提出了一种称为类别子空间正交化(CSO)的训练后检测方法。CSO识别出被自信地归类为已知类别但其内部表示与任何现有类别不符的输入,从而检测到潜在类别攻击的存在。 AI
影响 这项研究引入了一种新的数据投毒方法和相应的检测技术,可能影响AI系统对抗对抗性操纵的鲁棒性。
排序理由 该集群包含一篇详细介绍机器学习中新颖攻击和防御机制的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
- AI-based access control systems
- data poisoning
- class subspace orthogonalization
- deep learning
- latent class attack
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →