FrequencyFormer 管道提升了 Vision Transformer 在边缘设备的效率

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-19 04:00

研究人员开发了 FrequencyFormer，这是一个新颖的管道，旨在提高 Vision Transformer (ViTs) 在传感器边缘系统的部署效率。该方法利用频域压缩图像数据，减少了从传感器到处理器传输所需的能量和带宽。FrequencyFormer 使用多尺度 DCT 分词器创建紧凑的频域标记，在最小的精度损失下实现了显著的数据缩减。它还结合了近传感器硬件实现和修改后的通信架构，以进一步提高能效，在 TOPS/W 和通信能耗等性能指标上取得了显著的改进。 AI

影响使得 Vision Transformer 在资源受限的边缘设备上能够更高效地部署。

排序理由该集群包含一篇详细介绍新技术方法的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

FrequencyFormer 管道提升了 Vision Transformer 在边缘设备的效率

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Chengwei Zhou, Ovishake Sen, Xuming Chen, Rishith Paramasivam, Shaahin Angizi, Swarup Bhunia, Baibhab Chatterjee, Gourav Datta · 2026-06-19 04:00

FrequencyFormer: A Co-Designed Sensor-to-Processor Pipeline for Frequency-Domain Vision Transformer Inference

arXiv:2606.19574v1 Announce Type: cross Abstract: Deploying vision transformers (ViTs) on sensor-edge systems is limited not only by on-device compute, but also by the energy and bandwidth required to transmit high-dimensional image data from the sensor to the processor. While in…

报道来源 [1]

FrequencyFormer: A Co-Designed Sensor-to-Processor Pipeline for Frequency-Domain Vision Transformer Inference

相关实体

相关话题