研究人员发现,在剪枝大型语言模型时存在一种权衡:用于提高通用能力的校准数据可能会损害在编码和数学等专业任务上的性能。为解决此问题,他们提出了一种多源校准混合技术和一个名为IGSP的自动化协议。与单源校准相比,该方法显著提高了整体模型保留率,尤其是在高稀疏度水平下。 AI
影响 新的剪枝技术可能能够更有效地在各种任务中部署大型语言模型。
排序理由 学术论文,详细介绍了LLM剪枝的一种新颖方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →