研究人员推出RUB,一个旨在评估机器遗忘技术鲁棒性的基准。当前的遗忘方法常常无法保证完全移除敏感信息,并且容易受到旨在恢复已遗忘数据的对抗性攻击。RUB通过评估模型与重新训练的对应模型的不可区分性以及对各种威胁的抵御能力来解决这一问题,使用了分类、图像到图像重建和文本到图像合成任务。该基准包含一种新的攻击方法——遗忘映射攻击(UMA)——来检测残余信息,揭示即使是先进的遗忘方法也容易受到影响。 AI
影响 该基准通过改进数据隐私和内容监管技术的有效性,可能带来更安全可靠的AI模型。
排序理由 该集群描述了一篇介绍用于评估机器遗忘的基准和方法论的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →