PulseAugur
实时 23:45:00
English(EN) mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF just released !

Mudler 发布 Qwen3.6-35B 模型,集成 Claude 4.7 Opus 推理能力

mudler 发布了一个新的量化模型 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF。该模型基于 APEX(自适应精度专家模型)量化技术,并包含一个用于自推测解码的多令牌预测(MTP)头。MTP 头已直接打包到 GGUF 文件中,简化了与最新版本 llama.cpp 的使用。 AI

影响 支持在本地执行具有推测解码的高级推理模型。

排序理由 这是一个量化模型的发布,属于研究范畴。[lever_c_降级自研究:ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/PhotographerUSA ·

    mudler/Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled-APEX-MTP-GGUF 刚刚发布!

    <!-- SC_OFF --><div class="md"><p>Description of the module: </p> <p>I host <strong>30+ free APEX MoE quantizations</strong> as independent research. My only local hardware is an <strong>NVIDIA DGX Spark</strong> (122 GB unified memory) — enough for ~30-50B-class MoEs, but <stron…