English(EN) A Novel Latent-Class Attack and its Detection by Class Subspace Orthogonalization

arXiv论文详述了新的潜在类别攻击和检测方法

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了一种新的数据投毒技术，称为潜在类别攻击，它引入了一种新颖的、未知的类别数据，并将其错误标记为已知类别。这种攻击可能通过导致未知实体被归类为良性来绕过基于AI的安全系统。为了应对这种情况，提出了一种称为类别子空间正交化（CSO）的训练后检测方法。CSO识别出被自信地归类为已知类别但其内部表示与任何现有类别不符的输入，从而检测到潜在类别攻击的存在。 AI

影响这项研究引入了一种新的数据投毒方法和相应的检测技术，可能影响AI系统对抗对抗性操纵的鲁棒性。

排序理由该集群包含一篇详细介绍机器学习中新颖攻击和防御机制的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Guangmingmei Yang, David J. Miller, George Kesidis · 2026-06-30 04:00

一种新颖的潜在类别攻击及其通过类别子空间正交化进行的检测

arXiv:2606.29112v1 Announce Type: new Abstract: Deep learning, which in general relies on voluminous amounts of training data, is vulnerable to data poisoning attacks, including error-generic attacks and backdoors (Trojans). In this work, we propose a new data poisoning attack we…

报道来源 [1]

一种新颖的潜在类别攻击及其通过类别子空间正交化进行的检测

相关实体

相关话题