研究人员开发了一种新颖的位串行阵列架构,专为运行时可重构的多精度量化神经网络(QNN)设计。该架构解决了现有硬件乘法器无法为混合精度QNN模型动态调整精度的局限性。该设计在Ultra96 FPGA上实现并进行了测试,在混合精度模型推理方面展示了1.3185倍至3.5671倍的显著加速。它还具有缩短的关键路径延迟,能够实现高达250MHz的更高时钟频率。 AI
影响 该架构可以实现资源有限的边缘设备上更高效、更快速的复杂AI模型推理。
排序理由 该集群包含一篇详细介绍AI推理新硬件架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →