PulseAugur
实时 17:21:02
实体 198B-A11B vision MoE

198B-A11B vision MoE

PulseAugur coverage of 198B-A11B vision MoE — every cluster mentioning 198B-A11B vision MoE across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_114584 ·

    本地 LLM 优化:Step-3.7-Flash 速度提升 2.4 倍,MTP 破坏视觉

    一位开发者已针对本地硬件优化了 Step-3.7-Flash (198B-A11B vision MoE) 模型,取得了显著的性能提升。通过确保模型最大的量化 (IQ3_XXS) 完全驻留在四块 3090 GPU 的 96GB VRAM 中,他们观察到与溢出数据到 CPU 的更高量化 (IQ4_XS) 相比,速度提升了 2.4 倍。此外,开发者发现模型的推测解码功能 (MTP) 与其视觉能力不兼容,在处理图像 token 时会导致硬中止。