PulseAugur
实时 13:55:31
实体 Megamoe

Megamoe

PulseAugur coverage of Megamoe — every cluster mentioning Megamoe across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. FRONTIER RELEASE · CL_33854 ·

    DeepSeek V4 推出 MegaMoE 优化以实现高效 MoE

    DeepSeek 发布了其 V4 模型,该模型通过一个名为 MegaMoE 的新系统进行了显著优化。该系统使用一个 1400 行的融合 CUDA 内核,通过对模型层内的通信和计算进行细粒度流水线处理来提高性能。这种方法解决了 Mixture-of-Experts (MoE) 模型中通常需要大量 all-to-all 通信的挑战。