PulseAugur
实时 12:31:57
实体 Mixture of Activations (MoA)

Mixture of Activations (MoA)

PulseAugur coverage of Mixture of Activations (MoA) — every cluster mentioning Mixture of Activations (MoA) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_53504 ·

    新的MoA FFN设计增强了LLM的表现力和可扩展性

    研究人员为大型语言模型(LLM)引入了一种新颖的前馈网络(FFN)设计,称为激活混合(Mixture of Activations, MoA)。MoA利用了自适应激活混合,允许基于轻量级的、依赖输入的门控机制,将不同的激活函数应用于不同的token。这种方法理论上比固定的激活函数FFN和可学习激活函数(LA)具有更强的表现力。在从0.12B到2B参数的模型上进行的实证评估表明,MoA以最小的开销持续实现更低的终端损失和更好的可扩展性。