PulseAugur
实时 11:33:33
实体 Suncheng Xiang

Suncheng Xiang

PulseAugur coverage of Suncheng Xiang — every cluster mentioning Suncheng Xiang across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_123373 ·

    ExFusion 方法通过多专家融合提高 Transformer 训练效率

    研究人员开发了 ExFusion,一种旨在提高 Transformer 模型效率的新型预训练方法。该方法在初始化期间将前馈网络 (FFN) 升级为多专家配置,并分配权重以供后续参数融合。在训练过程中,这些专家会融合为单个统一专家,与标准的密集训练相比,计算成本大大降低。训练后,融合专家消除了额外的存储和部署开销,并且在计算机视觉和自然语言处理任务上的实验结果证明了其有效性。