PulseAugur
实时 10:51:13
English(EN) How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

新的初始化策略增强了稀疏深度神经网络和卷积神经网络的训练稳定性

研究人员为深度神经网络(DNN)和卷积神经网络(CNN)开发了一种新的初始化策略,该策略提高了训练稳定性,尤其是在高稀疏性场景下。该方法借鉴了混沌边缘(EoC)理论,该理论传统上认为方差随着深度的增加而趋近于零。然而,新方法证明了较大的固定高斯过程有利于高稀疏激活的训练稳定性,使得隐藏层稀疏度高达90%的网络能够被有效训练。 AI

影响 这项研究可能能够实现更高效的稀疏神经网络训练,从而在资源受限的环境中部署更小、更快的模型。

排序理由 该集群包含一篇学术论文,详细介绍了机器学习中的一项新研究发现和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Emily Dent, Jared Tanner ·

    How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

    arXiv:2602.05779v2 Announce Type: replace Abstract: The Edge-of-Chaos (EoC) theory developed for the random initialization of deep networks allows more efficient training by both preserving information in the initial outputs of the network and minimising exploding or vanishing gr…