English(EN) SHAPE: Coalition-Aware Expert Pruning for Sparse Mixture-of-Experts LLMs

SHAPE框架通过模拟专家联盟来剪枝MoE大语言模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 04:00

研究人员开发了一个名为SHAPE的新框架，用于剪枝稀疏专家混合（MoE）大语言模型中的专家。与之前独立评估专家的旧方法不同，SHAPE考虑了MoE推理的协作性质，即专家以联盟的形式协同工作。该框架使用一种类似Shapley的归因方法来识别对高价值协作至关重要的专家，从而实现更有效的剪枝。在Qwen3-30B-A3B、GPT-OSS-20B和DeepSeek-V2-Lite等模型上的实验表明，即使剪枝高达40%的专家，SHAPE也能在不显著损失准确性的情况下大幅减小内存占用。 AI

影响通过降低内存需求而不牺牲准确性，从而能够更高效地部署大型MoE模型。

排序理由该集群包含一篇详细介绍剪枝MoE大语言模型新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yuhao Zhang · 2026-06-10 04:00

SHAPE：稀疏专家混合LLM的联盟感知专家剪枝

arXiv:2606.09886v1 Announce Type: cross Abstract: Sparse Mixture-of-Experts (MoE) large language models achieve strong quality with low per-token compute, yet their deployment is often limited by the memory wall: the full expert pool must remain resident to support token-dependen…

报道来源 [1]

SHAPE：稀疏专家混合LLM的联盟感知专家剪枝

相关实体

相关话题