English(EN) I put together a Rust-native, CPU-only implementation of LFM2.5-8B-A1B

开发者发布 LFM2.5-8B-A1B 的原生 Rust、仅 CPU 实现

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 13:11

一位开发者创建了 LFM2.5-8B-A1B 语言模型的原生 Rust、仅 CPU 实现。这个仍在进行中的项目已作为 cargo crate 发布，并包含工具使用回调等功能。该实现可以在 Ryzen 7950x 上提供约 37 tokens/s 的解码速度，并且可以在内存仅为 16GB 的系统上运行，内存使用量约为 7GB。 AI

影响使得在没有专用 GPU 的消费级硬件上运行特定 LLM 成为可能。

排序理由这是用户创建的现有模型实现，而非前沿实验室发布的模型。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/maximecb · 2026-06-09 13:11

I put together a Rust-native, CPU-only implementation of LFM2.5-8B-A1B

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u14kte/i_put_together_a_rustnative_cpuonly/"> <img alt="I put together a Rust-native, CPU-only implementation of LFM2.5-8B-A1B" src="https://external-preview.redd.it/LrhhrCoZZIyfoDkMLpOkoulEbx6zqeOeio9WllRs9g…

报道来源 [1]

I put together a Rust-native, CPU-only implementation of LFM2.5-8B-A1B

相关实体

相关话题