English(EN) ViM-Q: Scalable Algorithm-Hardware Co-Design for Vision Mamba Model Inference on FPGA

ViM-Q 赋能FPGA上高效的Vision Mamba模型推理

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了ViM-Q，一种专为加速FPGA上Vision Mamba (ViM) 模型推理而设计的新型算法-硬件协同设计。该方法解决了量化动态激活离群值和为FPGA架构适配SSM计算的挑战。ViM-Q集成了定制的4位权重量化和一个包含线性引擎和流水线SSM引擎的硬件加速器，能够为多样化的ViM模型进行运行时配置。在AMD ZCU102 FPGA上的测试表明，与GPU基线相比，在低批量推理方面实现了显著的速度提升和能效增益。 AI

影响能够高效地将Vision Mamba模型部署到资源受限的边缘设备上。

排序理由详细介绍用于模型推理的新算法-硬件协同设计的学术论文。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Shengzhe Lyu, Yuhan She, Patrick S. Y. Hung, Ray C. C. Cheung, Weitao Xu · 2026-05-05 04:00

ViM-Q: 面向FPGA上Vision Mamba模型推理的可扩展算法-硬件协同设计

arXiv:2605.01935v1 Announce Type: cross Abstract: Vision Mamba (ViM) models offer a compelling efficiency advantage over Transformers by leveraging the linear complexity of State Space Models (SSMs), yet efficiently deploying them on FPGAs remains challenging. Linear layers strug…

报道来源 [1]

ViM-Q: 面向FPGA上Vision Mamba模型推理的可扩展算法-硬件协同设计

相关实体

相关话题