研究人员开发了TRINE,这是一种专为高效多模态AI推理设计的新型FPGA加速器。该系统将各种AI模型架构(包括ViTs、CNNs、GNNs和Transformer)统一到一个单一的可重构引擎中。与现有硬件相比,TRINE在延迟和功耗方面实现了显著降低,其特性如流内令牌修剪和依赖感知内核卸载为其性能提升做出了贡献。 AI
影响 TRINE在FPGA上实现高效多模态AI推理的进步,可能为嵌入式和边缘设备上更强大的AI应用提供支持。
排序理由 这是一篇详细介绍AI推理新硬件架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →