研究人员推出了一种新颖的方法PARE,用于提高视频扩散 Transformer (DiTs) 的计算效率。PARE通过结构感知剪枝和输入自适应路由联合压缩模型宽度和深度,以解决DiTs的高计算需求。该系统根据注意力头的空间或时间作用智能地剪枝注意力头,并采用轻量级路由器根据去噪时间步和视觉内容动态选择要执行的块。在Wan2.1-14B数据集上进行图像到视频和文本到视频生成的实验表明,PARE在保持视频质量的同时显著降低了每步计算量。 AI
影响 这项研究提供了一种降低视频生成模型计算成本的方法,可能促进更广泛的应用和更快的迭代。
排序理由 该集群包含一篇详细介绍提高AI模型效率新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →