研究人员开发了 EPnG,一种用于参数高效微调专家混合(MoE)模型的新框架。该方法通过剪枝利用率低的专家并增长高重要性的专家,在路由器门概率的指导下,自适应地重新分配微调容量。与 OLMoE 和 Qwen1.5-MoE 等 MoE 架构上的标准 LoRA 方法相比,EPnG 表现出更优越的性能,在更新显著更少比例的参数的同时,取得了与完全微调相当的结果。 AI
影响 这项研究为适应大型 MoE 模型提供了一种更有效、可扩展的策略,有望降低研究人员和开发者的计算成本。
排序理由 该集群包含一篇详细介绍微调 AI 模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →