English(EN) Ollama v0.30.0, Qwen3.5 35B, & 1-bit Multimodal AI on WebGPU

Ollama v0.30.0、Qwen3.5 35B 和 WebGPU 上的 1 位 AI

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-26 21:34

Ollama 的 v0.30.0 预发布版将改进 llama.cpp 的互操作性。此外，新的 Qwen3.5 35B 模型已提供 GGUF 和 GPTQ 格式，并针对消费级 GPU 上的本地推理进行了优化。另外，PrismML 发布了 Bonsai Image 4B，这是一个 1 位文本到图像的扩散模型，可以直接在 WebGPU 的浏览器中运行，显著降低了计算需求。 AI

影响通过优化的模型和基于浏览器的执行，增强了本地 AI 推理和多模态生成的可访问性。

排序理由该集群讨论了本地 AI 运行时更新和优化后的开源模型发布，而不是主要实验室发布的新前沿模型。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · soy · 2026-05-26 21:34

Ollama v0.30.0, Qwen3.5 35B, & 1-bit Multimodal AI on WebGPU

<h2> Ollama v0.30.0, Qwen3.5 35B, & 1-bit Multimodal AI on WebGPU </h2> <h3> Today's Highlights </h3> <p>This week, Ollama's v0.30.0 pre-release hints at improved <code>llama.cpp</code> interoperability, while a new Qwen3.5 35B model offers diverse quantization formats for ro…

报道来源 [1]

Ollama v0.30.0, Qwen3.5 35B, & 1-bit Multimodal AI on WebGPU

相关实体

相关话题