一篇新研究论文探讨了机器学习模型中“潜意识学习”的现象,即学生模型即使在非类别数据上进行训练,也能无意中从教师模型中习得特征。该研究使用MNIST数据集,证明了先前被认为是单步效应的梯度对齐,在多步训练中持续存在,并对这种无意特征习得起到了因果作用。此外,论文表明,提出的缓解技术“liminal training”在阻止这种学习方面无效。 AI
影响 表明当前的缓解方法可能不足以阻止模型产生意外行为。
排序理由 关于机器学习现象的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →