PulseAugur
实时 12:51:39
English(EN) Elastic ViTs from Pretrained Models without Retraining

SnapViT 可在无需重新训练的情况下实现弹性 Vision Transformer

研究人员开发了 SnapViT,这是一种创建弹性 Vision Transformer (ViTs) 的新颖方法,该方法可以在不重新训练的情况下适应各种计算预算。这种预训练后的结构化剪枝技术有效地结合了梯度信息和跨网络结构相关性,并通过进化算法进行近似。在多个预训练模型上的实验表明,SnapViT 在不同稀疏度下优于现有方法,并且可以在单个 A100 GPU 上在五分钟内生成可调模型。 AI

影响 能够根据不同的硬件约束更灵活地部署视觉模型。

排序理由 该集群包含一篇详细介绍适应现有模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Walter Simoncini, Michael Dorkenwald, Tijmen Blankevoort, Cees G. M. Snoek, Yuki M. Asano ·

    Elastic ViTs from Pretrained Models without Retraining

    arXiv:2510.17700v2 Announce Type: replace Abstract: Vision foundation models achieve remarkable performance but are only available in a limited set of pre-determined sizes, forcing sub-optimal deployment choices under real-world constraints. We introduce SnapViT: Single-shot netw…