Ollama 发布了候选版本 v0.30.0-rc32,其中包含对其 llama-server 功能的若干后续修复和改进。这些更新解决了 Windows 上多 GPU 支持的 ROCm 构建标志问题,改进了 AMD HIP 的版本检测,并确保了 embeddings API 的一致行为。此外,该版本还优化了显存受限情况下的批处理大小,修复了 Imagegen 中 v3 模型的加载错误,并增强了 embeddings 的模型重新加载过程。 AI
影响 通过改进的多 GPU 支持和 API 一致性,增强了本地 LLM 管理工具。
排序理由 这是用于管理 LLM 实例的工具的候选版本,而不是新的前沿模型发布。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →