PulseAugur
实时 07:16:18
实体 Yonatan Dukler

Yonatan Dukler

PulseAugur coverage of Yonatan Dukler — every cluster mentioning Yonatan Dukler across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58999 ·

    新的MoE架构通过重叠计算和通信来提高AI模型速度

    研究人员开发了FarSkip-Collective,这是一种用于混合专家(MoE)模型的新型架构修改,旨在提高分布式环境中的通信效率。该方法通过引入跳跃连接,使计算能够与通信重叠,即使对于Llama 4 Scout (109B)等大型架构,也能保持与原始模型相当的准确性。该方法在训练和推理方面都显示出显著的加速效果,在DeepSeek-V3推理过程中,首次令牌时间(Time To First Token)提高了32.6%,并在训练期间…