PulseAugur
实时 12:14:16
实体 MoE upcycling

MoE upcycling

PulseAugur coverage of MoE upcycling — every cluster mentioning MoE upcycling across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93378 ·

    新的SPRI方法在数据受限情况下增强了AI模型升级

    研究人员开发了一种名为SVD-Partitioned Residual Initialization (SPRI)的新方法,以改进将密集AI模型转换为更高效的专家混合(MoE)模型的过程,这项技术被称为MoE升级。该方法在处理数据有限的情况下尤其有益,因为它利用了预训练模型的结构,同时在专家之间引入了可控的多样性。SPRI在多语言语音转文本翻译任务中表现出显著的改进,优于标准的微调密集模型和以前的升级方法。