kNN-MoE 通过检索增强分配来增强 LLM 路由

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 04:00

研究人员开发了一种用于专家混合（MoE）模型的新路由机制，称为 kNN-MoE。该方法利用过去路由决策的记忆来动态地将 token 分配给专家，从而提高对分布变化的鲁棒性。该系统利用 k-近邻来查找过去的相似案例，并使用它们的相似性作为混合专家分配的置信度分数。实验表明，kNN-MoE 的性能优于标准的零样本方法，并与监督微调相当。 AI

影响通过改进 token 路由机制，提高了 MoE 模型的效率和鲁棒性。

排序理由该集群包含一篇研究论文，详细介绍了专家混合模型中一种新的路由方法。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Boxuan Lyu, Soichiro Murakami, Hidetaka Kamigaito, Peinan Zhang · 2026-05-26 04:00

Routing by Analogy: kNN-Augmented Expert Assignment for Mixture-of-Experts

arXiv:2601.02144v2 Announce Type: replace-cross Abstract: Mixture-of-Experts (MoE) architectures scale large language models efficiently by employing a parametric ``router'' to dispatch tokens to a sparse subset of experts. Typically, this router is trained once and then frozen, …

报道来源 [1]

Routing by Analogy: kNN-Augmented Expert Assignment for Mixture-of-Experts

相关实体

相关话题