一项新的研究论文介绍DODOCO,一个旨在诊断混合专家(MoE)模型调度操作中开销的工具。研究发现,关于基准测试中工作负载表示的常见假设以及系统层对路由不平衡的可纠正性是存在缺陷的。研究强调,模型架构,而非专家并行度,是决定性能区间的首要因素。 AI
影响 揭示了当前MoE基准测试的关键局限性,可能指导未来的互连和调度设计,以实现更准确的性能预测。
排序理由 该集群包含一篇研究论文,详细介绍了一个新工具以及关于MoE模型性能的发现。
- DeepSeek-MoE-16B
- DeepSeek-V2-Lite
- DODOCO
- H100s
- Mixture-of-Experts
- Nemotron-30B
- Qwen3-30B
- Qwen3.5-35B
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →