English(EN) Joint Architecture-Token-Bitwidth Multi-Axis Optimization of Vision Transformers for Semiconductor IC Packaging

研究人员优化视觉Transformer用于半导体检测

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了一个新颖的框架，用于在资源受限的工业环境中优化视觉Transformer（ViTs）的部署。该方法同时优化了架构、Token压缩和位宽精度，解决了ViTs的高计算成本和内存需求问题。将其应用于集成电路芯片封装的半导体缺陷分类，该框架在保持必要精度的同时，实现了超过十倍的吞吐量提升，以及参数量、FLOPs和能耗的十倍降低。 AI

影响这项研究可能能够更有效地将先进的视觉模型部署到半导体制造等专业工业应用中。

排序理由详细介绍视觉Transformer新颖优化框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Phat Nguyen, Xue Geng, Kaixin Xu, Wang Zhe, Xulei Yang, Ngai-Man Cheung · 2026-05-05 04:00

Joint Architecture-Token-Bitwidth Multi-Axis Optimization of Vision Transformers for Semiconductor IC Packaging

arXiv:2605.01742v1 Announce Type: new Abstract: Vision Transformers (ViTs) have achieved strong performance in visual recognition, yet their deployment in resource-constrained industrial environments remains limited. Some main challenges are their high computational cost, memory …

报道来源 [1]

Joint Architecture-Token-Bitwidth Multi-Axis Optimization of Vision Transformers for Semiconductor IC Packaging

相关实体

相关话题