PulseAugur
实时 13:23:50

NVIDIA发布量化版GLM-5.2 MoE模型,支持1M上下文

NVIDIA发布了GLM-5.2 NVFP4模型,这是ZAI的GLM-5.2的量化版本。该混合专家模型(Mixture-of-Experts)针对推理和编码任务进行了优化,具有稀疏注意力机制和100万token的上下文长度。该模型已准备好部署在AI代理系统、聊天机器人和RAG应用中,并根据MIT许可证提供。 AI

影响 这款具有1M上下文窗口的量化MoE模型有望加速在AI代理系统和RAG应用中的部署。

排序理由 NVIDIA发布前沿实验室模型及系统卡。[lever_c_从前沿发布降级:ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

NVIDIA发布量化版GLM-5.2 MoE模型,支持1M上下文

报道来源 [1]

  1. Hugging Face Trending Models TIER_1 Português(PT) · nvidia ·

    nvidia/GLM-5.2-NVFP4

    text-generation · 441 downloads · 64 likes