English(EN) New week, new slides: Run LLMs Locally Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-

发布了在本地运行 Qwen 和 ASR 模型的指南

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-18 22:03

Thomas Bley 发布了新的幻灯片，详细介绍了如何在本地运行大型语言模型。该演示文稿涵盖了使用 Nextn 量化的 Qwen3.6 35B-A3B 模型进行多 token 预测。它还包括有关使用 Qwen-3-ASR 进行语音识别的信息，该模型现在可以与 Llama.cpp 一起使用。 AI

影响提供了本地执行开源 LLM 和 ASR 模型的指南，从而能够进行更广泛的实验和使用。

排序理由该集群描述了一个关于在本地运行开源模型的技术演示和指南，属于研究与开发类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — fosstodon.org 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] · 2026-05-18 22:03

New week, new slides: Run LLMs Locally Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-

New week, new slides: Run LLMs Locally Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides. https:// codeberg.org/thbley/talks/raw/ branch/ma…

链接 codeberg.org/…/Run_LLMs_Locally_2026_Thom…

报道来源 [1]

New week, new slides: Run LLMs Locally Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-

相关实体

相关话题