PulseAugur
实时 06:26:58
实体 k-quants

k-quants

PulseAugur coverage of k-quants — every cluster mentioning k-quants across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_79340 ·

    llama.cpp PR 将 k-quant 模型速度提升高达 3.78 倍

    llama.cpp 项目的一个拉取请求(pull request)为 k-quantized 模型引入了优化,显著提高了预填充速度。这些更改侧重于各种量化级别(包括 Q4、Q5 和 Q8)的矩阵乘法(matmul)操作。在 M2 Pro 芯片上的基准测试显示,某些量化的速度提升高达 3.78 倍,从而提高了本地大型语言模型的性能。