PulseAugur
实时 10:29:00
实体 cyankiwi/GLM-5.2-AWQ-INT4

cyankiwi/GLM-5.2-AWQ-INT4

PulseAugur coverage of cyankiwi/GLM-5.2-AWQ-INT4 — every cluster mentioning cyankiwi/GLM-5.2-AWQ-INT4 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_110108 ·

    GLM-5.2 模型速度通过自定义优化提升超过 20 倍

    一位 Reddit 用户详细介绍了一种在专用 GH200 系统上显著加速 GLM-5.2 大型语言模型的方法。通过组合不同存储库的组件并修补 vLLM 推理引擎,该用户实现了超过每秒 50 个 token 的推理速度,相比模型初始性能有了显著提升。该过程涉及将 zai-org/GLM-5.2-FP8 存储库的权重与 cyankiwi/GLM-5.2-AWQ-INT4 的 AWQ 量化版本合并。