研究人员在扩散模型的高维蒸馏中发现了一种称为“复制”的现象。当蒸馏出的学生模型复制教师模型的原始噪声-数据配对时,就会发生这种情况,而在低维设置中并未观察到这种行为。研究表明,这种复制是由于学生模型在蒸馏过程中几何自由度有限而产生的涌现特性,而不是对抗性目标或教师记忆所致。 AI
影响 识别出扩散模型蒸馏中的一种新行为,可能影响压缩模型的效率和泛化能力。
排序理由 该集群包含一篇详细介绍模型蒸馏新发现的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →