PulseAugur
实时 10:28:06
实体 zai-org/GLM-5.2-FP8

zai-org/GLM-5.2-FP8

PulseAugur coverage of zai-org/GLM-5.2-FP8 — every cluster mentioning zai-org/GLM-5.2-FP8 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_110108 ·

    GLM-5.2 模型速度通过自定义优化提升超过 20 倍

    一位 Reddit 用户详细介绍了一种在专用 GH200 系统上显著加速 GLM-5.2 大型语言模型的方法。通过组合不同存储库的组件并修补 vLLM 推理引擎,该用户实现了超过每秒 50 个 token 的推理速度,相比模型初始性能有了显著提升。该过程涉及将 zai-org/GLM-5.2-FP8 存储库的权重与 cyankiwi/GLM-5.2-AWQ-INT4 的 AWQ 量化版本合并。

  2. SIGNIFICANT · CL_95287 ·

    Z.ai 发布 GLM-5.2,支持百万级上下文并采用开源许可

    Z.ai 发布了 GLM-5.2,这是一款专为长时任务设计的新旗舰模型,拥有百万级 token 的上下文窗口。该模型通过可调节的努力级别提高了编码能力,并采用名为 IndexShare 的增强架构,降低了长上下文的计算成本。GLM-5.2 以 MIT 开源许可发布,允许全球无限制的访问和技术使用。