一篇新论文探讨了深度 ReLU 网络的实现图,研究了函数在考虑了缩放和置换对称性的情况下,何时能唯一确定其参数。该研究引入了一个使用加权多面体复形来分析隐藏冗余的框架。一个关键发现是,对于输入层和隐藏层宽度至少为二的架构,存在一个可识别参数的开放集,这意味着函数维度等于参数数量减去隐藏神经元数量。 AI
影响 为深度 ReLU 网络的参数可识别性提供了理论见解,可能影响未来的架构设计和优化策略。
排序理由 该集群包含一篇在 arXiv 上发表的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →