NVIDIA 发布了 Alibaba 的 Qwen3.6-35B-A3B 模型的量化版本,命名为 nvidia/Qwen3.6-35B-A3B-NVFP4。该模型使用 NVFP4 数据类型,将内存需求减少约 3.06 倍,同时在各种基准测试中保持了有竞争力的性能。它针对 AI 代理系统、聊天机器人和 RAG 系统进行了优化部署,并已准备好商用。 AI
影响 降低了 Qwen 模型的内存占用并提高了推理速度,从而能够在资源受限的 AI 应用中更广泛地部署。
排序理由 这是量化模型的发布,附带基准测试结果,但它是现有模型的衍生版本,并非顶级实验室发布的新前沿模型。
在 Hugging Face Trending Models 阅读 →
- AA-LCR
- AIME 2025
- Alibaba
- GPQA Diamond
- IFBench
- MMLU Pro
- MMMU PRO
- Model Optimizer
- NVFP4
- NVIDIA
- Qwen3.6-35B-A3B
- Qwen3.6-35B-A3B-NVFP4
- SciCode
- vLLM
- τ²-Bench Telecom
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →