PulseAugur
实时 19:21:46
English(EN) Can an MLP Absorb Its Own Skip Connection?

MLP 跳跃连接无法被吸收进无残差模型

研究人员调查了一个单隐藏层 MLP 周围的跳跃连接是否可以被吸收进一个相同宽度的无残差 MLP。他们发现,对于 ReLU^2 和 ReGLU 等某些激活函数,由于次数参数的原因,吸收是不可能的。对于 SwiGLUGeGLU 等门控激活函数,线性化参数也得出了相同的结论。虽然在特定的、非通用的权重条件下,吸收对于无门控的 ReLU 和 GELU 是可能的,但跳跃连接和无残差的 MLP 通常代表不同的函数类别。 AI

影响 探讨了 MLP 架构的理论局限性,可能影响未来的模型设计。

排序理由 这是一篇发表在 arXiv 上的研究论文,讨论了 MLP 的理论特性。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

MLP 跳跃连接无法被吸收进无残差模型

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Antonij Mijoski, Marko Karbevski ·

    Can an MLP Absorb Its Own Skip Connection?

    arXiv:2604.23705v1 Announce Type: new Abstract: We study when a skip connection around a single-hidden-layer MLP can be absorbed into a residual-free MLP of the same width. We first show that for any architecture whose skip branch is an invertible linear map (including Hyper-Conn…