English(EN) Qwen3.6-35B-A3B Local Setup 2026: Ollama and 24GB VRAM

Alibaba 的 Qwen3.6-35B-A3B 模型在 24GB GPU 上提供高效的 35B 知识

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-25 07:04

Alibaba 的 Qwen 团队发布的 Qwen3.6-35B-A3B 模型采用了稀疏专家混合（MoE）架构，使其能够以 3B 参数模型的效率运行，同时保留 35B 参数模型的知识。这种设计显著降低了显存需求，使其有可能通过量化在单个 24GB GPU 上运行，尽管由于 KV 缓存增长，长上下文长度仍然可能对内存造成压力。该模型根据 Apache 2.0 许可发布，可用于不受限制的商业用途，并可以使用 Ollama 进行本地设置，提供与 OpenAI 兼容的 API，从而实现编辑器内的编码辅助。 AI

影响使得在消费级硬件上运行大容量模型成为可能，从而可能降低高级 AI 开发和部署的门槛。

排序理由主要 AI 实验室（Alibaba/Qwen）发布的新模型。[lever_c_降级自 frontier_release: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Alibaba 的 Qwen3.6-35B-A3B 模型在 24GB GPU 上提供高效的 35B 知识

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Jovan Chan · 2026-06-25 07:04

Qwen3.6-35B-A3B Local Setup 2026: Ollama and 24GB VRAM

<blockquote> This article was originally published on <a href="https://aifoss.dev/blog/qwen36-35b-a3b-local-setup-2026/" rel="noopener noreferrer">aifoss.dev</a> </blockquote> TL;DR: Qwen3.6-35B-A3B is a 35B Mixture-of-Experts model with only ~3B active…

报道来源 [1]

Qwen3.6-35B-A3B Local Setup 2026: Ollama and 24GB VRAM

相关实体

相关话题