Ollama 发布了 0.30.8 版本,带来多项改进和修复。主要更新包括解决了 `ollama launch` 选择错误提供者的问题,并增强了提示缓存以更好地重用 KV 缓存。此次发布还通过加固层提高了 MLX 推理的稳定性,并改进了循环模型支持。 AI
影响 增强了本地 LLM 部署工具的可用性和稳定性。
排序理由 这是用于运行本地 LLM 的工具的软件发布,不是新的前沿模型发布或重大的行业事件。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →