PulseAugur
实时 20:36:39
实体 SO(d_model)

SO(d_model)

PulseAugur coverage of SO(d_model) — every cluster mentioning SO(d_model) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_50968 ·

    研究人员发现独立训练的Transformer通过随机旋转计算相同函数

    研究人员发现了一个称为“多态性”的现象,在独立训练的Transformer中,它们计算相同的函数,但使用不同的内部坐标系,这些坐标系是彼此旋转的版本。这种在SO(d_model)内均匀随机的旋转使得模型之间的内部表示难以理解。然而,使用正交Procrustes拟合的单个矩阵乘法可以对齐这些基,从而无需重新训练即可在模型之间转移特征字典和引导向量。