Thomas Bley 发布了新的幻灯片,详细介绍了如何在本地运行大型语言模型。该演示文稿涵盖了使用 Nextn 量化的 Qwen3.6 35B-A3B 模型进行多 token 预测。它还包括有关使用 Qwen-3-ASR 进行语音识别的信息,该模型现在可以与 Llama.cpp 一起使用。 AI
影响 提供了本地执行开源 LLM 和 ASR 模型的指南,从而能够进行更广泛的实验和使用。
排序理由 该集群描述了一个关于在本地运行开源模型的技术演示和指南,属于研究与开发类别。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →