PulseAugur
实时 04:45:06
实体 GLM-5.2-FP8

GLM-5.2-FP8

PulseAugur coverage of GLM-5.2-FP8 — every cluster mentioning GLM-5.2-FP8 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_97458 ·

    GLM-5.2-FP8 在 HGX-H200 上部署,支持 262k 上下文

    一位用户分享了他们使用 SGLang 在 HGX-H200 系统上部署 GLM-5.2-FP8 的 Docker 配置。该配置实现了 262k 的上下文窗口和每秒 70 个 token 的吞吐量。用户指出,为了优化性能,禁用了一些标志,如 DP 和 moe-a2a-backend,并且由于 DSV3 架构上的 FP8 量化,官方 vLLM 配方不适用于 H200。