mudler 发布了一个新的量化模型 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF。该模型基于 APEX(自适应精度专家模型)量化技术,并包含一个用于自推测解码的多令牌预测(MTP)头。MTP 头已直接打包到 GGUF 文件中,简化了与最新版本 llama.cpp 的使用。 AI
影响 支持在本地执行具有推测解码的高级推理模型。
排序理由 这是一个量化模型的发布,属于研究范畴。[lever_c_降级自研究:ic=1 ai=1.0]
- APEX
- Blackwell
- Claude 4.7 Opus
- H200
- llama.cpp
- NVIDIA DGX Spark
- Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →