PulseAugur
实时 09:29:56
English(EN) TENP: Trapezoidal Expert Neuron Pruning For Mixture-of-Experts

新的剪枝技术TENP以最小的性能损失减小了MoE大语言模型的规模

研究人员开发了一种名为TENP(梯形专家神经元剪枝)的新剪枝技术,专门用于混合专家(MoE)大语言模型。该方法旨在通过以结构化的梯形模式选择性地剪枝不太重要的专家和神经元,来减小MoE模型庞大的静态参数占用的空间。在Qwen和DeepSeek模型上的实验表明,TENP可以在准确性损失很小的情况下实现显著的参数缩减,甚至在代码生成任务上提高了性能。 AI

影响 这项技术可以通过减小内存占用,从而实现更高效的大型MoE模型的部署。

排序理由 该集群包含一篇详细介绍大语言模型新剪枝方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv stat.ML 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv stat.ML TIER_1 English(EN) · Jiangyang He, Shaolin Zhu, Deyi Xiong ·

    TENP: Trapezoidal Expert Neuron Pruning For Mixture-of-Experts

    arXiv:2606.09885v1 Announce Type: cross Abstract: Mixture-of-Experts large language models (LLMs) scale efficiently through sparse activation, yet their deployment is fundamentally constrained by the large static parameter footprint of experts. Existing compression approaches eit…