实体 Qwen3.6-27B-UD-Q8_K_XL

Qwen3.6-27B-UD-Q8_K_XL

PulseAugur coverage of Qwen3.6-27B-UD-Q8_K_XL — every cluster mentioning Qwen3.6-27B-UD-Q8_K_XL across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_71636 · Jun 4 · 17:22

Qwen 3.6 27B 模型通过自定义量化实现基准测试改进

一位 r/LocalLLaMA 用户分享了对 Qwen 3.6 27B 模型两个量化版本的基准测试对比：Qwen3.6-27B-UD-Q8_K_XL 和 Qwen3.6-27B-Q8-CC。该用户开发了一种自定义量化方法，专注于量化后异常值较高的层，旨在提高性能。初步结果表明，尽管自定义量化版本 (Qwen3.6-27B-Q8-CC) 文件尺寸较小，但在 KLD 和 Delta P 指标方面可能提供略微更好的性能。
TOOL · CL_68678 · Jun 3 · 05:05

llama.cpp build b9455 在 Qwen3.6-27B 上实现 70+ tokens/sec

Reddit 的 r/LocalLLaMA 社区的一位用户分享了使用新版 llama.cpp（具体为 b9455 版本）取得的令人印象深刻的性能提升。该更新版本结合了跨两块 RTX 3090 GPU 的张量拆分，在使用 Qwen3.6-27B-UD-Q8_K_XL 模型时，实现了每秒超过 70 个 token 的速度。这显著超过了之前每秒 30-50 个 token 的速度范围，并达到了之前仅在 vLLM 上才能看到的性能。

Qwen 3.6 27B 模型通过自定义量化实现基准测试改进

llama.cpp build b9455 在 Qwen3.6-27B 上实现 70+ tokens/sec