PulseAugur
实时 16:33:53

FrequencyFormer 管道提升了 Vision Transformer 在边缘设备的效率

研究人员开发了 FrequencyFormer,这是一个新颖的管道,旨在提高 Vision Transformer (ViTs) 在传感器边缘系统的部署效率。该方法利用频域压缩图像数据,减少了从传感器到处理器传输所需的能量和带宽。FrequencyFormer 使用多尺度 DCT 分词器创建紧凑的频域标记,在最小的精度损失下实现了显著的数据缩减。它还结合了近传感器硬件实现和修改后的通信架构,以进一步提高能效,在 TOPS/W 和通信能耗等性能指标上取得了显著的改进。 AI

影响 使得 Vision Transformer 在资源受限的边缘设备上能够更高效地部署。

排序理由 该集群包含一篇详细介绍新技术方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

FrequencyFormer 管道提升了 Vision Transformer 在边缘设备的效率

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Chengwei Zhou, Ovishake Sen, Xuming Chen, Rishith Paramasivam, Shaahin Angizi, Swarup Bhunia, Baibhab Chatterjee, Gourav Datta ·

    FrequencyFormer: A Co-Designed Sensor-to-Processor Pipeline for Frequency-Domain Vision Transformer Inference

    arXiv:2606.19574v1 Announce Type: cross Abstract: Deploying vision transformers (ViTs) on sensor-edge systems is limited not only by on-device compute, but also by the energy and bandwidth required to transmit high-dimensional image data from the sensor to the processor. While in…