可以在 ESP32 微控制器上运行一个拥有 1450 万参数的 tinyBERT LLM,特别是 ESP32-S3 N16R8 型号,它配备了 16MB 闪存和 8MB PSRAM。该过程涉及将模型的参数矩阵转换为 ONNX 格式,然后将其从 32 位浮点量化为 4 位整数。这种优化是必要的,因为 Transformer 模型通常使用 32 位浮点数进行矩阵乘法。 AI
影响 使得在资源受限的边缘设备上部署小型 LLM 成为可能,从而可能扩展嵌入式系统中的 AI 功能。
排序理由 该项目描述了在特定硬件上运行 LLM 的技术实现,属于工具或基础设施类别,而不是核心 AI 发布或研究。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →