研究人员开发了一种名为 MIVE(Minimalist Integer Vector Engine,极简整数向量引擎)的新硬件架构,旨在加速大语言模型(LLMs)中的关键操作。MIVE 是一种可编程引擎,可以在单个数据通路中高效处理 Softmax、LayerNorm 和 RMSNorm 功能,从而减少对重复硬件资源的需求。ASIC 实现表明,与现有针对这些操作的独立加速器相比,MIVE 在面积和硬件效率方面均有所提高。 AI
影响 MIVE 的高效硬件设计有望实现更快、更节能的大语言模型推理。
排序理由 该集群描述了一篇详细介绍用于加速大语言模型操作的新型硬件架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →