English(EN) EPnG: Adaptive Expert Prune-and-Grow for Parameter-Efficient MoE Fine-tuning

新的 EPnG 框架提升了 MoE 模型微调的效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-03 04:00

研究人员开发了 EPnG，一种用于参数高效微调专家混合（MoE）模型的新框架。该方法通过剪枝利用率低的专家并增长高重要性的专家，在路由器门概率的指导下，自适应地重新分配微调容量。与 OLMoE 和 Qwen1.5-MoE 等 MoE 架构上的标准 LoRA 方法相比，EPnG 表现出更优越的性能，在更新显著更少比例的参数的同时，取得了与完全微调相当的结果。 AI

影响这项研究为适应大型 MoE 模型提供了一种更有效、可扩展的策略，有望降低研究人员和开发者的计算成本。

排序理由该集群包含一篇详细介绍微调 AI 模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Ahin Lee, Sehyun Yun, Taesik Gong · 2026-07-03 04:00

EPnG: Adaptive Expert Prune-and-Grow for Parameter-Efficient MoE Fine-tuning

arXiv:2607.01789v1 Announce Type: cross Abstract: Mixture-of-Experts (MoE) models scale efficiently but remain costly to adapt due to redundant experts and uniform parameter allocation. Existing parameter-efficient fine-tuning (PEFT) methods such as LoRA ignore MoE routing dynami…

报道来源 [1]

EPnG: Adaptive Expert Prune-and-Grow for Parameter-Efficient MoE Fine-tuning

相关实体

相关话题