PulseAugur
实时 04:25:57
Deutsch(DE) RT @vllm_project: TRANSLASATION: vLLM v0.24.0 ist da! 571 Commits von 256 Mitwirkenden (77 neue). 🎉 Highlights: MiniMax-M3-Unterstützung (FP8/MXFP4 + breite AMD

vLLM 发布 v0.24.0,支持 MiniMax M3 和 AMD

vLLM 发布了 0.24.0 版本,该版本汇集了 256 位开发者的贡献和 571 次提交。此次更新引入了对 MiniMax M3 的支持,包括 FP8 和 MXFP4 精度,以及广泛的 AMD 兼容性。 AI

影响 通过新的模型和硬件支持增强了 LLM 推理能力。

排序理由 这是一个开源项目关于 LLM 推理的软件发布,属于研究/工具类别。[lever_c_demoted from research: ic=1 ai=1.0]

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

vLLM 发布 v0.24.0,支持 MiniMax M3 和 AMD

报道来源 [1]

  1. Mastodon — mastodon.social TIER_1 Deutsch(DE) · [email protected] ·

    RT @vllm_project: 翻译:vLLM v0.24.0 现已发布!来自 256 位贡献者(77 位新加入)的 571 次提交。🎉 要点:支持 MiniMax-M3(FP8/MXFP4 + 广泛的 AMD

    RT @vllm_project: TRANSLASATION: vLLM v0.24.0 ist da! 571 Commits von 256 Mitwirkenden (77 neue). 🎉 Highlights: MiniMax-M3-Unterstützung (FP8/MXFP4 + breite AMD-Optimierung), DeepSeek-V4 reift weiter (FlashInfer Sparse-Index-Cache, Prefill-Chunk-Planning, jetzt auf SM120), Model …