PulseAugur
实时 19:29:18
实体 Alexander Kozachinskiy

Alexander Kozachinskiy

PulseAugur coverage of Alexander Kozachinskiy — every cluster mentioning Alexander Kozachinskiy across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_22102 ·

    AI理论论文表明Transformer在奇偶性任务上至少需要两层

    研究人员证明,两层Transformer模型是计算PARITY任务(确定二进制序列中1的数量是偶数还是奇数)所需的最低层数。他们证明,单层Transformer由于其平均敏感性增长慢于PARITY,因此无法解决该问题。此外,一种新的构造表明,PARITY可以通过四层Transformer计算,而无需长度依赖的位置编码或hardmax等不切实际的假设,并且与因果掩码兼容。