English(EN) Restoring Initial Noise Sensitivity in Text-to-Image Distillation via Geometric Alignment

新的蒸馏方法恢复文本到图像模型中的噪声敏感性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了一个名为几何感知蒸馏（GAD）的新框架，以改进文本到图像生成模型。该方法解决了蒸馏模型中初始噪声敏感性丧失的问题，这会阻碍下游控制任务。GAD通过匹配与输入噪声相关的雅可比向量积，来对齐教师模型和学生模型的局部功能行为。实验表明，GAD在保持视觉质量的同时，成功恢复了噪声敏感性并增强了多样性。 AI

影响通过在蒸馏过程中保留关键的噪声敏感性，增强了文本到图像模型中的控制和多样性。

排序理由该集群包含一篇详细介绍改进生成模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Huayang Huang, Ruoyu Wang, Jinhui Zhao, Wei Deng, Daiguo Zhou, Jian Luan, Yu Wu, Ye Zhu · 2026-06-02 04:00

通过几何对齐恢复文本到图像蒸馏中的初始噪声敏感性

arXiv:2606.01651v1 Announce Type: new Abstract: Generative distillation significantly accelerates text-to-image (T2I) generation by compressing multi-step trajectories into few-step student models while preserving perceptual quality. However, existing methods primarily optimize e…

报道来源 [1]

通过几何对齐恢复文本到图像蒸馏中的初始噪声敏感性

相关实体

相关话题