English(EN) Layerwise Progressive Freezing: A Training Scaffold for Depth-Scalable Binary Networks

新的StoMPP方法改进了二值神经网络的训练

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-26 06:37

研究人员推出了一种新颖的二值神经网络（BNN）训练方法StoMPP（Stochastic Masked Partial Progressive Binarization，随机掩码部分渐进式二值化），该方法避免了在使用直通估计器（STE）时通常会遇到的更深层网络精度下降问题。StoMPP从输入到输出逐渐二值化网络层，在ResNet-50、MobileNetV2和BERT等各种架构中提供了显著的精度提升，即使在不使用STE的情况下也是如此。当与代理梯度结合使用时，这种渐进式二值化进一步提高了性能，研究强调层进展顺序对于防止梯度阻塞和保持网络深度至关重要。 AI

影响这项研究提供了一种新颖的二值神经网络训练方法，有望为资源受限设备上的部署实现更高效的模型。

排序理由该集群包含一篇详细介绍二值神经网络新训练方法的论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.LG TIER_1 English(EN) · Evan Gibson Smith, Bashima Islam · 2026-06-29 04:00

Layerwise Progressive Freezing: A Training Scaffold for Depth-Scalable Binary Networks

arXiv:2606.27759v1 Announce Type: new Abstract: Training binary neural networks (BNNs) from scratch is dominated by the straight-through estimator (STE), whose forward/backward mismatch produces severe accuracy degradation as networks deepen. We study an orthogonal axis: when and…
arXiv cs.LG TIER_1 English(EN) · Bashima Islam · 2026-06-26 06:37

逐层渐进式冻结：深度可伸缩二值网络的训练支架

Training binary neural networks (BNNs) from scratch is dominated by the straight-through estimator (STE), whose forward/backward mismatch produces severe accuracy degradation as networks deepen. We study an orthogonal axis: when and where binarization is enforced during training.…

报道来源 [2]

Layerwise Progressive Freezing: A Training Scaffold for Depth-Scalable Binary Networks

逐层渐进式冻结：深度可伸缩二值网络的训练支架

相关实体

相关话题