PulseAugur
实时 08:28:50
English(EN) Qwen 3.6 35B MoE: IQ3_M vs IQ4_NL for Aider/vibe coding?

用户寻求关于 Qwen 3.6 35B MoE 量化以用于编码的建议

一位 Reddit r/LocalLLaMA 社区的用户正在寻求关于为 Qwen 3.6 35B MoE 模型选择两种量化格式 IQ3_MIQ4_NL 的建议。选择的关键在于平衡性能和 VRAM 使用量,因为 IQ4_NL 格式可能会超出用户 16GB VRAM 的限制并溢出到系统内存。用户主要使用 OllamaAider 等工具进行“vibe 编码”,并正在权衡逻辑和语法精度可能损失与将模型完全保留在 VRAM 内的速度优势。 AI

影响 用户层面关于优化本地 LLM 编码任务性能的讨论。

排序理由 用户关于模型量化和性能权衡的讨论。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/unkclxwn ·

    Qwen 3.6 35B MoE: IQ3_M 对比 IQ4_NL 用于 Aider/vibe 编码?

    <!-- SC_OFF --><div class="md"><p>Rn im running Ollama + Aider on Linux (rx9070xt 16GB, 32GB ram). This is strictly for vibe coding, nothing enterprise<br /> im trying to decide between IQ3\_M and IQ4\_NL for “Qwen 3.6 35B-A3B MoE”</p> <p>IQ3\_M fits entirely in my 16GB vram. IQ4…