研究人员开发了一种新颖的深度神经网络剪枝方法,该方法利用了随机矩阵理论的原理,特别是 Marchenko-Pastur 分布。该方法旨在即使在剪枝后进行最小的微调也能保持准确性,侧重于高效校准而非广泛的重新优化。该技术为准确性保持提供了理论保证,并为剪枝决策提供了数据路径证书。在 ImageNet-1k 上使用 ViT-B/16 和 ConvNeXtV2-Base 等模型进行的实验表明,在保持高准确性的同时,MAC 显著减少且速度加快。 AI
影响 这项研究提供了一种更有效的方法来减小模型尺寸和计算成本,有可能加速大型模型的部署。
排序理由 该集群包含一篇学术论文,详细介绍了深度神经网络剪枝的新方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →