PulseAugur
实时 23:51:10
实体 Mix-of-Experts

Mix-of-Experts

PulseAugur coverage of Mix-of-Experts — every cluster mentioning Mix-of-Experts across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_10233 ·

    DORA系统通过新颖的异步部署将LLM强化学习加速2-4倍

    研究人员开发了DORA,一种新颖的异步强化学习系统,旨在加速语言模型训练。DORA通过采用多版本流式部署,允许并发策略版本,解决了部署阶段长尾轨迹造成的瓶颈。该系统在基准测试上的吞吐量比现有方法高出2-3倍,在大型工业环境中的训练速度快2-4倍。由此产生的开源模型LongCat-Flash-Thinking在复杂推理任务上表现出竞争力。