PulseAugur
实时 12:26:57
English(EN) Layerwise Progressive Freezing: A Training Scaffold for Depth-Scalable Binary Networks

新的StoMPP方法改进了二值神经网络的训练

研究人员推出了一种新颖的二值神经网络(BNN)训练方法StoMPP(Stochastic Masked Partial Progressive Binarization,随机掩码部分渐进式二值化),该方法避免了在使用直通估计器(STE)时通常会遇到的更深层网络精度下降问题。StoMPP从输入到输出逐渐二值化网络层,在ResNet-50、MobileNetV2和BERT等各种架构中提供了显著的精度提升,即使在不使用STE的情况下也是如此。当与代理梯度结合使用时,这种渐进式二值化进一步提高了性能,研究强调层进展顺序对于防止梯度阻塞和保持网络深度至关重要。 AI

影响 这项研究提供了一种新颖的二值神经网络训练方法,有望为资源受限设备上的部署实现更高效的模型。

排序理由 该集群包含一篇详细介绍二值神经网络新训练方法的论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的StoMPP方法改进了二值神经网络的训练

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Evan Gibson Smith, Bashima Islam ·

    Layerwise Progressive Freezing: A Training Scaffold for Depth-Scalable Binary Networks

    arXiv:2606.27759v1 Announce Type: new Abstract: Training binary neural networks (BNNs) from scratch is dominated by the straight-through estimator (STE), whose forward/backward mismatch produces severe accuracy degradation as networks deepen. We study an orthogonal axis: when and…

  2. arXiv cs.LG TIER_1 English(EN) · Bashima Islam ·

    逐层渐进式冻结:深度可伸缩二值网络的训练支架

    Training binary neural networks (BNNs) from scratch is dominated by the straight-through estimator (STE), whose forward/backward mismatch produces severe accuracy degradation as networks deepen. We study an orthogonal axis: when and where binarization is enforced during training.…