一个名为 ANEForge 的新 Python 包允许开发者直接对 Apple Neural Engine (ANE) 进行编程,而无需依赖 CoreML。这种绕过方式可以更有效地利用 ANE,ANE 是 Apple 设备中专用的神经网络加速器。ANEForge 将张量图编译成 ANE 程序,支持诸如融合注意力、各种权重格式,甚至直接在引擎上进行训练步骤等操作。这使得模型执行速度显著加快,例如 ResNet-18 前向传播仅需 0.33 毫秒即可完成。 AI
排序理由 详细介绍用于硬件加速的新软件工具的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →