English(EN) GLM5.2 on AMD MI355X at 2626 tok/s/node at over 2x lower cost than Blackwell

GLM5.2 部署在 AMD MI355X 上以实现更便宜的推理 · 已追踪 5 个来源

作者 PulseAugur 编辑部 · [5 个来源] · 2026-07-03 21:49

Wafer.ai 已成功将 GLM5.2 部署在 AMD MI355X 硬件上，实现了 2626 tokens/秒/节点的吞吐量和 213 tokens/秒的单流推理速度。此次部署具有成本优势，MI355X GPU 的成本大约比 NVIDIA 的 Blackwell B300 低 2.75 倍。优化工作包括使用 AMD Quark 将 GLM5.2 量化到 MXFP4，并采用 sglang 推理框架，同时对 ROCm 的投机解码进行了特定修改。 AI

影响加速了经济高效的推理解决方案的采用，可能降低部署大型语言模型的门槛。

排序理由该集群详细介绍了在替代硬件上部署前沿模型的经济高效方案，突显了优化 AI 推理成本的重大行业趋势。

在 Hacker News — AI stories ≥50 points 阅读 →

AI 生成摘要 · Google Gemini · 来自 5 个来源。我们如何撰写摘要 →

GLM5.2 部署在 AMD MI355X 上以实现更便宜的推理 · 已追踪 5 个来源

报道来源 [5]

Hacker News — AI stories ≥50 points TIER_1 English(EN) · latchkey · 2026-07-03 21:49

GLM5.2 在 AMD MI355X 上以 2626 token/秒/节点运行，成本低于 Blackwell 的 2 倍以上
Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] · 2026-07-03 23:06

Leanstral 1.5：为所有人提供充足的证明 https:// mistral.ai/news/leanstral-1-5/ # ai

Leanstral 1.5: Proof Abundance for All https:// mistral.ai/news/leanstral-1-5/ # ai

链接 mistral.ai/…/leanstral-1-5
Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] · 2026-07-03 23:06

GLM5.2 在 AMD MI355X 上以 2626 token/秒/节点运行，成本低于 Blackwell 的 2 倍以上 https://www.wafer.ai/blog/glm52-amd #ai #amd

GLM5.2 on AMD MI355X at 2626 tok/s/node at over 2x lower cost than Blackwell https://www. wafer.ai/blog/glm52-amd # ai # amd

链接 wafer.ai/…/glm52-amd
Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] · 2026-07-03 22:33

Leanstral 1.5：人人皆可证明 https://mistral.ai/news/leanstral-1-5/ # HackerNews # Tech # AI

Leanstral 1.5: Proof Abundance for All https://mistral.ai/news/leanstral-1-5/ # HackerNews # Tech # AI

链接 mistral.ai/…/leanstral-1-5
Mastodon — sigmoid.social TIER_1 English(EN) · [email protected] · 2026-07-03 21:49

GLM5.2 在 AMD MI355X 上以 2626 tok/s/节点运行，成本低于 Blackwell 的 2 倍以上 https://www.wafer.ai/blog/glm52-amd # HackerNews # Tech # AI

GLM5.2 on AMD MI355X at 2626 tok/s/node at over 2x lower cost than Blackwell https://www.wafer.ai/blog/glm52-amd # HackerNews # Tech # AI

链接 wafer.ai/…/glm52-amd

报道来源 [5]

GLM5.2 在 AMD MI355X 上以 2626 token/秒/节点运行，成本低于 Blackwell 的 2 倍以上

Leanstral 1.5：为所有人提供充足的证明 https:// mistral.ai/news/leanstral-1-5/ # ai

GLM5.2 在 AMD MI355X 上以 2626 token/秒/节点运行，成本低于 Blackwell 的 2 倍以上 https://www.wafer.ai/blog/glm52-amd #ai #amd

Leanstral 1.5：人人皆可证明 https://mistral.ai/news/leanstral-1-5/ # HackerNews # Tech # AI

GLM5.2 在 AMD MI355X 上以 2626 tok/s/节点运行，成本低于 Blackwell 的 2 倍以上 https://www.wafer.ai/blog/glm52-amd # HackerNews # Tech # AI

相关实体

相关话题