Reddit 用户在 r/LocalLLaMA 板块分享了一项基准测试,比较了 Qwen 3.6 模型的两个版本在配备 M5 Pro 芯片和 64GB 内存的 MacBook Pro 上的表现。使用 4 位量化的 35B A3B 模型在速度和编码任务质量上均显著优于使用 6 位量化的 27B UD 模型。尽管 35B 模型体积更小且占用的内存更少,但在一个包含 4 个任务的编码基准测试中,其速度快了约 8 倍,并且获得了更高的总分。 AI
影响 为在 Apple Silicon 上运行本地 LLM 提供了实际性能数据,有助于用户进行硬件和模型选择。
排序理由 用户生成的基准测试,比较了两个模型版本在特定硬件上的表现。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →