English(EN) Qwen 3.6 35B MoE: IQ3_M vs IQ4_NL for Aider/vibe coding?

用户寻求关于 Qwen 3.6 35B MoE 量化以用于编码的建议

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 00:24

一位 Reddit r/LocalLLaMA 社区的用户正在寻求关于为 Qwen 3.6 35B MoE 模型选择两种量化格式 IQ3_M 和 IQ4_NL 的建议。选择的关键在于平衡性能和 VRAM 使用量，因为 IQ4_NL 格式可能会超出用户 16GB VRAM 的限制并溢出到系统内存。用户主要使用 Ollama 和 Aider 等工具进行“vibe 编码”，并正在权衡逻辑和语法精度可能损失与将模型完全保留在 VRAM 内的速度优势。 AI

影响用户层面关于优化本地 LLM 编码任务性能的讨论。

排序理由用户关于模型量化和性能权衡的讨论。

在 r/LocalLLaMA 阅读 →

产品

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/unkclxwn · 2026-06-12 00:24

Qwen 3.6 35B MoE: IQ3_M 对比 IQ4_NL 用于 Aider/vibe 编码？

<div class="md"><p>Rn im running Ollama + Aider on Linux (rx9070xt 16GB, 32GB ram). This is strictly for vibe coding, nothing enterprise<br /> im trying to decide between IQ3\_M and IQ4\_NL for “Qwen 3.6 35B-A3B MoE”</p> <p>IQ3\_M fits entirely in my 16GB vram. IQ4…

报道来源 [1]

Qwen 3.6 35B MoE: IQ3_M 对比 IQ4_NL 用于 Aider/vibe 编码？

相关实体

相关话题