English(EN) Can an MLP Absorb Its Own Skip Connection?

MLP 跳跃连接无法被吸收进无残差模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员调查了一个单隐藏层 MLP 周围的跳跃连接是否可以被吸收进一个相同宽度的无残差 MLP。他们发现，对于 ReLU^2 和 ReGLU 等某些激活函数，由于次数参数的原因，吸收是不可能的。对于 SwiGLU 和 GeGLU 等门控激活函数，线性化参数也得出了相同的结论。虽然在特定的、非通用的权重条件下，吸收对于无门控的 ReLU 和 GELU 是可能的，但跳跃连接和无残差的 MLP 通常代表不同的函数类别。 AI

影响探讨了 MLP 架构的理论局限性，可能影响未来的模型设计。

排序理由这是一篇发表在 arXiv 上的研究论文，讨论了 MLP 的理论特性。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Antonij Mijoski, Marko Karbevski · 2026-04-28 04:00

Can an MLP Absorb Its Own Skip Connection?

arXiv:2604.23705v1 Announce Type: new Abstract: We study when a skip connection around a single-hidden-layer MLP can be absorbed into a residual-free MLP of the same width. We first show that for any architecture whose skip branch is an invertible linear map (including Hyper-Conn…

报道来源 [1]

Can an MLP Absorb Its Own Skip Connection?

相关实体

相关话题