一位 r/LocalLLaMA 用户分享了对 Qwen 3.6 27B 模型两个量化版本的基准测试对比:Qwen3.6-27B-UD-Q8_K_XL 和 Qwen3.6-27B-Q8-CC。该用户开发了一种自定义量化方法,专注于量化后异常值较高的层,旨在提高性能。初步结果表明,尽管自定义量化版本 (Qwen3.6-27B-Q8-CC) 文件尺寸较小,但在 KLD 和 Delta P 指标方面可能提供略微更好的性能。 AI
影响 自定义量化技术可能为本地运行的 LLM 带来性能提升。
排序理由 用户生成的量化模型基准测试和比较,非官方发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →