PulseAugur
实时 05:06:50
实体 Wafer.ai

Wafer.ai

PulseAugur coverage of Wafer.ai — every cluster mentioning Wafer.ai across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. SIGNIFICANT · CL_124570 ·

    GLM5.2 部署在 AMD MI355X 上以实现更便宜的推理 · 已追踪 5 个来源

    Wafer.ai 已成功将 GLM5.2 部署在 AMD MI355X 硬件上,实现了 2626 tokens/秒/节点 的吞吐量和 213 tokens/秒 的单流推理速度。此次部署具有成本优势,MI355X GPU 的成本大约比 NVIDIA 的 Blackwell B300 低 2.75 倍。优化工作包括使用 AMD Quark 将 GLM5.2 量化到 MXFP4,并采用 sglang 推理框架,同时对 ROCm 的投机解码进…