PulseAugur
实时 13:43:06
English(EN) FTerViT: Fully Ternary Vision Transformer

全三元视觉Transformer实现微控制器的高压缩率

研究人员开发了FTerViT,一种全三元视觉Transformer,它压缩了所有权重矩阵和归一化参数。这种方法显著减小了模型的内存占用,使其更容易部署在资源受限的设备上,如微控制器。FTerViT在ImageNet上实现了具有竞争力的准确率,同时与标准的浮点模型相比提供了大幅压缩。 AI

影响 使得在低功耗边缘设备上更有效地部署先进的视觉模型成为可能。

排序理由 该集群包含一篇详细介绍新模型架构及其在基准测试上性能的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Nadim Maamari ·

    FTerViT: Fully Ternary Vision Transformer

    Ternary Vision Transformers offer substantial model compression, however state-of-the-art methods only ternarize the encoder layers, leaving patch embeddings, LayerNorm parameters, and classifier heads in full precision. In compact models targeting resource-constrained processors…