Alibaba 的 Qwen 团队发布的 Qwen3.6-35B-A3B 模型采用了稀疏专家混合(MoE)架构,使其能够以 3B 参数模型的效率运行,同时保留 35B 参数模型的知识。这种设计显著降低了显存需求,使其有可能通过量化在单个 24GB GPU 上运行,尽管由于 KV 缓存增长,长上下文长度仍然可能对内存造成压力。该模型根据 Apache 2.0 许可发布,可用于不受限制的商业用途,并可以使用 Ollama 进行本地设置,提供与 OpenAI 兼容的 API,从而实现编辑器内的编码辅助。 AI
影响 使得在消费级硬件上运行大容量模型成为可能,从而可能降低高级 AI 开发和部署的门槛。
排序理由 主要 AI 实验室(Alibaba/Qwen)发布的新模型。[lever_c_降级自 frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →