PulseAugur
实时 18:55:38
(CA) v0.30.0-rc32: llama-server followups (#16353)

Ollama v0.30.0-rc32 改进了多 GPU 支持和 embeddings API

Ollama 发布了候选版本 v0.30.0-rc32,其中包含对其 llama-server 功能的若干后续修复和改进。这些更新解决了 Windows 上多 GPU 支持的 ROCm 构建标志问题,改进了 AMD HIP 的版本检测,并确保了 embeddings API 的一致行为。此外,该版本还优化了显存受限情况下的批处理大小,修复了 Imagegen 中 v3 模型的加载错误,并增强了 embeddings 的模型重新加载过程。 AI

影响 通过改进的多 GPU 支持和 API 一致性,增强了本地 LLM 管理工具。

排序理由 这是用于管理 LLM 实例的工具的候选版本,而不是新的前沿模型发布。

在 Ollama — Releases 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Ollama v0.30.0-rc32 改进了多 GPU 支持和 embeddings API

报道来源 [2]

  1. Ollama — Releases TIER_1 (CA) · dhiltgen ·

    v0.30.0-rc32: llama-server 后续更新 (#16353)

    <ul> <li>llama-server followups</li> </ul> <p>Misc fixes for <a class="issue-link js-issue-link" href="https://github.com/ollama/ollama/pull/16031">#16031</a></p> <ul> <li>Add back dropped ROCm build flag for multi-GPU support on windows</li> <li>Fix amdhip64_*.dll version detect…

  2. r/LocalLLaMA TIER_1 (SL) · /u/m94301 ·

    Llama Studio v0.2.0

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tt4pag/llama_studio_v020/"> <img alt="Llama Studio v0.2.0" src="https://preview.redd.it/nbasscdzwi4h1.png?width=640&amp;crop=smart&amp;auto=webp&amp;s=bb1e756b21ae5bbb4df943d6de083c54859f2022" title="Llama St…