实体 q4_k_xl

q4_k_xl

PulseAugur coverage of q4_k_xl — every cluster mentioning q4_k_xl across labs, papers, and developer communities, ranked by signal.

总计 · 30天

0

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_77165 · Jun 8 · 04:26

Google 的 QATs 显示出比 Unsloth 变体更高的精度

r/LocalLLaMA 上的一位用户观察到，Google 的 QATs（量化感知训练）Q4_0 模型似乎比 Unsloth 的 Q4_K_XL 变体具有更高的精度，这与预期相反。这一观察基于文件大小和张量数量，其中 Google 的 Q4_0 模型有时比 Unsloth 的 Q4_K_XL 更大，这表明量化策略或实现方式存在差异。用户正在寻求关于为何会出现这种差异以及如何正确分析 GGUF 文件中张量数据的解释。
TOOL · CL_70683 · Jun 4 · 07:54

Jetson AGX Orin 64GB 使用 q8_0 量化可加快 LLM 预填充速度

一位用户在 r/LocalLLaMA 子版块分享了 Jetson AGX Orin 64GB 的性能观察结果，指出使用 q8_0 量化方法处理模型时，提示词处理速度明显快于 q6_k 和 q4_k_xl。该用户在最近的 llama.cpp 构建版本上使用 Unsloth Qwen3.6-27B-MTP-GGUF 模型进行了测试，观察到 q8_0 的速度提升超过 20%。他们推测，Jetson 的 CUDA 核心可能没有针对该特定硬件上…