NVIDIA发布量化版GLM-5.2 MoE模型，支持1M上下文

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-22 19:55

NVIDIA发布了GLM-5.2 NVFP4模型，这是ZAI的GLM-5.2的量化版本。该混合专家模型（Mixture-of-Experts）针对推理和编码任务进行了优化，具有稀疏注意力机制和100万token的上下文长度。该模型已准备好部署在AI代理系统、聊天机器人和RAG应用中，并根据MIT许可证提供。 AI

影响这款具有1M上下文窗口的量化MoE模型有望加速在AI代理系统和RAG应用中的部署。

排序理由 NVIDIA发布前沿实验室模型及系统卡。[lever_c_从前沿发布降级：ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

GLM-5.2
Hugging Face
MIT License
Nemotron-Competitive-Programming-v1
Nemotron-Math-v2
Nemotron-Science-v1
Nemotron-SFT-Agentic-v2
Nemotron-SFT-Instruction-Following-Chat-v2
Nemotron-SFT-Multilingual-v1
Nemotron-SFT-SWE-v2
NVIDIA
NVIDIA Blackwell
nvidia/GLM-5.2-NVFP4
SGLang
vLLM

模型发布
产品

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Hugging Face Trending Models TIER_1 Português(PT) · nvidia · 2026-06-22 19:55

nvidia/GLM-5.2-NVFP4

text-generation · 441 downloads · 64 likes

报道来源 [1]

nvidia/GLM-5.2-NVFP4

相关实体

相关话题