vLLM 发布了 0.24.0 版本,该版本汇集了 256 位开发者的贡献和 571 次提交。此次更新引入了对 MiniMax M3 的支持,包括 FP8 和 MXFP4 精度,以及广泛的 AMD 兼容性。 AI
影响 通过新的模型和硬件支持增强了 LLM 推理能力。
排序理由 这是一个开源项目关于 LLM 推理的软件发布,属于研究/工具类别。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →