arXiv上的一篇新论文质疑了当前机器学习“反学习”(MU)评估方法的有效性。研究人员发现,标准的输出级指标,如遗忘集准确率和logit级成员推理,可能高估了“反学习”的成功率。通过与从头开始重新训练的模型进行比较,研究表明,许多当前的MU方法即使在输出级遗忘似乎已完全实现时,也表现出表示空间中的结构化不匹配。这表明当前的评估可能认证的是表面上的遗忘,而不是与真正重新训练一致的“反学习”。 AI
影响 对当前评估机器学习“反学习”的方法提出了挑战,表明需要更鲁棒的指标来评估真实的数据删除。
排序理由 发表在arXiv上的学术论文,讨论机器学习“反学习”评估方法。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- forget data
- forget-set accuracy
- logit-level membership inference
- machine unlearning
- output forgetting
- Representation spaces of the Jordan plane
- retrained model
- retraining-consistent representation forgetting
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →