(CA) v0.30.0-rc32: llama-server followups (#16353)

Ollama v0.30.0-rc32 改进了多 GPU 支持和 embeddings API

作者 PulseAugur 编辑部 · [2 个来源] · 2026-05-31 19:21

Ollama 发布了候选版本 v0.30.0-rc32，其中包含对其 llama-server 功能的若干后续修复和改进。这些更新解决了 Windows 上多 GPU 支持的 ROCm 构建标志问题，改进了 AMD HIP 的版本检测，并确保了 embeddings API 的一致行为。此外，该版本还优化了显存受限情况下的批处理大小，修复了 Imagegen 中 v3 模型的加载错误，并增强了 embeddings 的模型重新加载过程。 AI

影响通过改进的多 GPU 支持和 API 一致性，增强了本地 LLM 管理工具。

排序理由这是用于管理 LLM 实例的工具的候选版本，而不是新的前沿模型发布。

在 Ollama — Releases 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

Ollama v0.30.0-rc32 改进了多 GPU 支持和 embeddings API

报道来源 [2]

Ollama — Releases TIER_1 (CA) · dhiltgen · 2026-06-01 17:44

v0.30.0-rc32: llama-server 后续更新 (#16353)

<ul> <li>llama-server followups</li> </ul> <p>Misc fixes for <a class="issue-link js-issue-link" href="https://github.com/ollama/ollama/pull/16031">#16031</a></p> <ul> <li>Add back dropped ROCm build flag for multi-GPU support on windows</li> <li>Fix amdhip64_*.dll version detect…
r/LocalLLaMA TIER_1 (SL) · /u/m94301 · 2026-05-31 19:21

Llama Studio v0.2.0

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tt4pag/llama_studio_v020/"> <img alt="Llama Studio v0.2.0" src="https://preview.redd.it/nbasscdzwi4h1.png?width=640&crop=smart&auto=webp&s=bb1e756b21ae5bbb4df943d6de083c54859f2022" title="Llama St…

报道来源 [2]

v0.30.0-rc32: llama-server 后续更新 (#16353)

Llama Studio v0.2.0

相关实体

相关话题