NVIDIA发布了GLM-5.2 NVFP4模型,这是ZAI的GLM-5.2的量化版本。该混合专家模型(Mixture-of-Experts)针对推理和编码任务进行了优化,具有稀疏注意力机制和100万token的上下文长度。该模型已准备好部署在AI代理系统、聊天机器人和RAG应用中,并根据MIT许可证提供。 AI
影响 这款具有1M上下文窗口的量化MoE模型有望加速在AI代理系统和RAG应用中的部署。
排序理由 NVIDIA发布前沿实验室模型及系统卡。[lever_c_从前沿发布降级:ic=1 ai=1.0]
在 Hugging Face Trending Models 阅读 →
- GLM-5.2
- Hugging Face
- MIT License
- Nemotron-Competitive-Programming-v1
- Nemotron-Math-v2
- Nemotron-Science-v1
- Nemotron-SFT-Agentic-v2
- Nemotron-SFT-Instruction-Following-Chat-v2
- Nemotron-SFT-Multilingual-v1
- Nemotron-SFT-SWE-v2
- NVIDIA
- NVIDIA Blackwell
- nvidia/GLM-5.2-NVFP4
- SGLang
- vLLM
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →