研究人员开发了AQ4SViT,一个自动化的框架,旨在压缩脉冲视觉Transformer (SViTs),以用于资源受限的嵌入式AI系统。该新框架通过采用一种利用膜电位漂移作为性能代理的搜索门控策略,解决了手动量化的可扩展性问题。AQ4SViT提供两种搜索变体:贪婪搜索,速度更快但可能找到局部最优解;束搜索,速度较慢但旨在找到全局最优解。实验表明,AQ4SViT-Greedy可实现高达82.5%的内存节省,AQ4SViT-Beam可实现高达90%的内存节省,同时保持高精度。 AI
影响 该框架可以实现更高效的AI模型在边缘设备上的部署,扩展嵌入式AI系统的能力。
排序理由 该集群包含一篇在arXiv上发表的研究论文,详细介绍了一个新的模型压缩框架。
在 arXiv cs.NE (Neural & Evolutionary) 阅读 →
- AQ4SViT
- Beam search
- embedded AI systems
- Greedy search
- ImageNet
- Rachmad Vidya Wicaksana Putra
- Spiking Vision Transformers
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →