PulseAugur
实时 10:22:19
实体 q4_k_xl

q4_k_xl

PulseAugur coverage of q4_k_xl — every cluster mentioning q4_k_xl across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_70683 ·

    Jetson AGX Orin 64GB 使用 q8_0 量化可加快 LLM 预填充速度

    一位用户在 r/LocalLLaMA 子版块分享了 Jetson AGX Orin 64GB 的性能观察结果,指出使用 q8_0 量化方法处理模型时,提示词处理速度明显快于 q6_k 和 q4_k_xl。该用户在最近的 llama.cpp 构建版本上使用 Unsloth Qwen3.6-27B-MTP-GGUF 模型进行了测试,观察到 q8_0 的速度提升超过 20%。他们推测,Jetson 的 CUDA 核心可能没有针对该特定硬件上…