PulseAugur
实时 09:58:09
English(EN) Mitigating scalability challenges in LUT-based neural networks via pruning optimisations

新的LUT-MU架构提升神经网络效率和可扩展性

研究人员开发了一种新颖的基于查找表(LUT)的近似矩阵乘法单元(LUT-MU),旨在提高神经网络的可扩展性和能效。这种新架构将剪枝策略集成到MADDNESS算法中,有效地管理了更大问题规模和更高精度要求下的资源扩展。将此LUT-MU部署到包括用于MNIST、CIFAR-10和ImageNet数据集的神经网络架构中,与传统的基于CUDA和量化实现相比,在吞吐量和能效方面显示出显著的改进,而对精度的影响很小。 AI

排序理由 该集群包含一篇学术论文,详细介绍了优化神经网络硬件实现的新技术方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Xuqi Zhu, Huaizhi Zhang, JunKyu Lee, Jiacheng Zhu, Chandrajit Pal, Sangeet Saha, Klaus D. McDonald-Maier, Xiaojun Zhai ·

    Mitigating scalability challenges in LUT-based neural networks via pruning optimisations

    arXiv:2407.02362v3 Announce Type: replace-cross Abstract: Modern deep neural networks heavily rely on a large number of multiply-accumulate operations, which constitute the predominant computational cost. To address this, Look-Up Table (LUT)-based matrix multiplications have emer…