PulseAugur
实时 20:52:14
实体 Qwen3.6-27B-UD-Q8_K_XL

Qwen3.6-27B-UD-Q8_K_XL

PulseAugur coverage of Qwen3.6-27B-UD-Q8_K_XL — every cluster mentioning Qwen3.6-27B-UD-Q8_K_XL across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_71636 ·

    Qwen 3.6 27B 模型通过自定义量化实现基准测试改进

    一位 r/LocalLLaMA 用户分享了对 Qwen 3.6 27B 模型两个量化版本的基准测试对比:Qwen3.6-27B-UD-Q8_K_XL 和 Qwen3.6-27B-Q8-CC。该用户开发了一种自定义量化方法,专注于量化后异常值较高的层,旨在提高性能。初步结果表明,尽管自定义量化版本 (Qwen3.6-27B-Q8-CC) 文件尺寸较小,但在 KLD 和 Delta P 指标方面可能提供略微更好的性能。

  2. TOOL · CL_68678 ·

    llama.cpp build b9455 在 Qwen3.6-27B 上实现 70+ tokens/sec

    Reddit 的 r/LocalLLaMA 社区的一位用户分享了使用新版 llama.cpp(具体为 b9455 版本)取得的令人印象深刻的性能提升。该更新版本结合了跨两块 RTX 3090 GPU 的张量拆分,在使用 Qwen3.6-27B-UD-Q8_K_XL 模型时,实现了每秒超过 70 个 token 的速度。这显著超过了之前每秒 30-50 个 token 的速度范围,并达到了之前仅在 vLLM 上才能看到的性能。