研究人员开发了HGQ-LUT,一种用于训练基于查找表(LUT)的神经网络的新方法,该方法显著加快了训练过程,在现代GPU上速度提升超过100倍。该方法引入了专门的层和细粒度量化,以自动探索精度-资源权衡,无需手动调整。HGQ-LUT已集成到开源工具链中,能够为像CERN大型强子对撞机这样的应用实际部署这些高效的DNN。 AI
影响 加速FPGA上的DNN训练,为要求苛刻的应用实现更高效的实时推理。
排序理由 这是一篇详细介绍FPGA上DNN新训练方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →