vLLM 发布了 0.22.1rc1 版本,其中包括停止为 flashinfer-jit-cache 使用 extra-index-url 的一项更改。此更新解决了项目缓存机制中的一个特定技术细节。发布说明表明,用户反馈受到高度重视并被纳入开发中。 AI
影响 对推理引擎的次要更新,不太可能对行业产生广泛影响。
排序理由 这是一个开源项目的次要软件版本发布,不是主要模型发布或重要的行业事件。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →