PulseAugur
实时 09:31:19
English(EN) Most ReLU Networks Admit Identifiable Parameters

研究人员发现大多数 ReLU 网络具有可识别的参数

一篇新论文探讨了深度 ReLU 网络的实现图,研究了函数在考虑了缩放和置换对称性的情况下,何时能唯一确定其参数。该研究引入了一个使用加权多面体复形来分析隐藏冗余的框架。一个关键发现是,对于输入层和隐藏层宽度至少为二的架构,存在一个可识别参数的开放集,这意味着函数维度等于参数数量减去隐藏神经元数量。 AI

影响 为深度 ReLU 网络的参数可识别性提供了理论见解,可能影响未来的架构设计和优化策略。

排序理由 该集群包含一篇在 arXiv 上发表的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

研究人员发现大多数 ReLU 网络具有可识别的参数

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Moritz Grillo, Guido Mont\'ufar ·

    Most ReLU Networks Admit Identifiable Parameters

    arXiv:2605.03601v1 Announce Type: new Abstract: We study the realization map of deep ReLU networks, focusing on when a function determines its parameters up to scaling and permutation. To analyze hidden redundancies beyond these standard symmetries, we introduce a framework based…

  2. arXiv cs.LG TIER_1 English(EN) · Guido Montúfar ·

    Most ReLU Networks Admit Identifiable Parameters

    We study the realization map of deep ReLU networks, focusing on when a function determines its parameters up to scaling and permutation. To analyze hidden redundancies beyond these standard symmetries, we introduce a framework based on weighted polyhedral complexes. Our main resu…