研究人员开发了一个名为几何感知蒸馏(GAD)的新框架,以改进文本到图像生成模型。该方法解决了蒸馏模型中初始噪声敏感性丧失的问题,这会阻碍下游控制任务。GAD通过匹配与输入噪声相关的雅可比向量积,来对齐教师模型和学生模型的局部功能行为。实验表明,GAD在保持视觉质量的同时,成功恢复了噪声敏感性并增强了多样性。 AI
影响 通过在蒸馏过程中保留关键的噪声敏感性,增强了文本到图像模型中的控制和多样性。
排序理由 该集群包含一篇详细介绍改进生成模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →