Hugging Face 推出了其 Text Generation Inference (TGI) 解决方案的新功能 TGI Multi-LoRA。此增强功能允许用户从单个部署中同时服务多达30个不同的 LoRA (Low-Rank Adaptation) 模型。这显著提高了效率,并减少了服务多个专业模型所需的计算资源。 AI
排序理由 这是对现有 AI 基础设施工具 Hugging Face 的 Text Generation Inference 的一项新功能发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →