Ollama 的 v0.30.0 预发布版将改进 llama.cpp 的互操作性。此外,新的 Qwen3.5 35B 模型已提供 GGUF 和 GPTQ 格式,并针对消费级 GPU 上的本地推理进行了优化。另外,PrismML 发布了 Bonsai Image 4B,这是一个 1 位文本到图像的扩散模型,可以直接在 WebGPU 的浏览器中运行,显著降低了计算需求。 AI
影响 通过优化的模型和基于浏览器的执行,增强了本地 AI 推理和多模态生成的可访问性。
排序理由 该集群讨论了本地 AI 运行时更新和优化后的开源模型发布,而不是主要实验室发布的新前沿模型。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →