PulseAugur
实时 18:48:00
English(EN) Diagnosing Overhead in Dispatch Operations: Cross-architecture Observatory

新工具DODOCO揭示MoE模型调度基准测试中的缺陷

一项新的研究论文介绍DODOCO,一个旨在诊断混合专家(MoE)模型调度操作中开销的工具。研究发现,关于基准测试中工作负载表示的常见假设以及系统层对路由不平衡的可纠正性是存在缺陷的。研究强调,模型架构,而非专家并行度,是决定性能区间的首要因素。 AI

影响 揭示了当前MoE基准测试的关键局限性,可能指导未来的互连和调度设计,以实现更准确的性能预测。

排序理由 该集群包含一篇研究论文,详细介绍了一个新工具以及关于MoE模型性能的发现。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新工具DODOCO揭示MoE模型调度基准测试中的缺陷

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Bole Ma, Jan Eitzinger, Harald Koestler, Gerhard Wellein ·

    Diagnosing Overhead in Dispatch Operations: Cross-architecture Observatory

    arXiv:2605.20982v1 Announce Type: cross Abstract: AlltoAll dispatch is the dominant bottleneck of MoE expert parallelism, and the interconnect community has responded with four families of mitigations: predictive sample placement, adaptive expert relayout, hierarchical collective…

  2. arXiv cs.AI TIER_1 English(EN) · Gerhard Wellein ·

    Diagnosing Overhead in Dispatch Operations: Cross-architecture Observatory

    AlltoAll dispatch is the dominant bottleneck of MoE expert parallelism, and the interconnect community has responded with four families of mitigations: predictive sample placement, adaptive expert relayout, hierarchical collectives, and EP-aware topology. All four rest on two ass…