研究人员推出了一种名为 Sigma-Branch (SigmaB) 的新颖框架,旨在优化内存受限的边缘设备的深度神经网络。SigmaB 将密集网络重构为具有共享骨干、路由器和专用叶子的分层树,从而实现动态推理。通过仅执行一条从根到叶的路径,这种方法显著减少了每次推理的活动参数数量,从而在不牺牲模型整体容量的情况下最大限度地减少了片外权重传输。 AI
影响 每次推理的活动参数减少多达 60%,从而能够在内存有限的边缘设备上更有效地部署 AI。
排序理由 该集群包含一篇详细介绍新神经网络优化框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →