English(EN) How Modular Is a Frontier Mixture-of-Experts? A Pre-registered Causal Test in Which Apparent Expert Modularity Mostly Dissolves

研究质疑前沿混合专家模型（Mixture-of-Experts）的模块化程度

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-25 04:00

一项新近发表在arXiv上的研究，调查了混合专家模型（MoE）的模块化程度，特别是对Command A+模型进行了测试。研究发现，这些模型中明显的函数模块化很少见，并且高度依赖于测量条件，只有一类预注册的能力表现出稳健的模块化。该研究采用了消融技术，并在Qwen3-30B-A3B上进行了对照测试以验证其方法论，最终得出结论，基于消融的模块化评估需要仔细控制语料库、指标和统计阈值。 AI

影响挑战了对大型语言模型可解释性和功能专业化的假设。

排序理由分析AI模型架构和能力的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Tony Salomone, Deep Gandhi, Ali Asaria · 2026-06-25 04:00

How Modular Is a Frontier Mixture-of-Experts? A Pre-registered Causal Test in Which Apparent Expert Modularity Mostly Dissolves

arXiv:2606.25092v1 Announce Type: new Abstract: Sparse Mixture-of-Experts (MoE) models route each token to a few of many experts, inviting the hypothesis that experts form functional modules tied to capabilities or languages. We test this causally on Command A+, a frontier open-w…

报道来源 [1]

How Modular Is a Frontier Mixture-of-Experts? A Pre-registered Causal Test in Which Apparent Expert Modularity Mostly Dissolves

相关实体

相关话题