摩尔线程宣布,在其MTT S5000 AI训练和推理GPU上,对智谱AI新开源的旗舰模型GLM-5.2进行了快速的Day-0适配。此次适配基于此前对GLM-5.1的优化工作,重点关注GLM-5.2的超长上下文和复杂的推理需求。该公司旨在利用MTT S5000的高吞吐量能力,特别是在长输入预填充阶段。 AI
影响 通过优化复杂推理任务的硬件性能,加速了先进大模型的部署。
排序理由 该集群详细介绍了在AI硬件上对特定模型的适配和优化,符合研究类别。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →