English(EN) SVD-Surgeon: Optimal Singular-Value Surgery for Large Language Model Compression

新的SVD-Surgeon方法无需重新训练即可优化LLM压缩

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 16:33

研究人员开发了SVD-Surgeon，一种新颖的、无需训练即可使用奇异值分解（SVD）压缩大型语言模型（LLM）的方法。该技术直接优化奇异值，提供一种封闭形式的更新，以补偿移除的组件并识别要修剪的值。当应用于现有的SVD压缩器（如SVD-LLM）时，SVD-Surgeon在不重新训练的情况下，提高了OPT和LLaMA 2-7B等模型的困惑度-压缩权衡。 AI

影响该方法可以通过减小大型语言模型的计算和内存占用，从而实现更高效的部署。

排序理由该集群包含一篇详细介绍LLM压缩新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Frank Hutter · 2026-06-22 16:33

SVD-Surgeon: Optimal Singular-Value Surgery for Large Language Model Compression

Large language models (LLMs) achieve remarkable performance across a wide range of tasks, but their deployment is constrained by substantial memory and compute requirements. Low-rank compression via singular value decomposition (SVD) is an effective remedy, but existing methods f…

报道来源 [1]

SVD-Surgeon: Optimal Singular-Value Surgery for Large Language Model Compression

相关实体

相关话题