English(EN) mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF just released !

Mudler 发布 Qwen3.6-35B 模型，集成 Claude 4.7 Opus 推理能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-31 05:05

mudler 发布了一个新的量化模型 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF。该模型基于 APEX（自适应精度专家模型）量化技术，并包含一个用于自推测解码的多令牌预测（MTP）头。MTP 头已直接打包到 GGUF 文件中，简化了与最新版本 llama.cpp 的使用。 AI

影响支持在本地执行具有推测解码的高级推理模型。

排序理由这是一个量化模型的发布，属于研究范畴。[lever_c_降级自研究：ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/PhotographerUSA · 2026-05-31 05:05

mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 刚刚发布！

<div class="md">Description of the module: I host 30+ free APEX MoE quantizations as independent research. My only local hardware is an NVIDIA DGX Spark (122 GB unified memory) — enough for ~30-50B-class MoEs, but <stron…

报道来源 [1]

mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 刚刚发布！

相关实体

相关话题