Ollama
PulseAugur coverage of Ollama — every cluster mentioning Ollama across labs, papers, and developer communities, ranked by signal.
- 2026-05-26 product_launch Ollama released version v0.30.0-rc26. 来源
- 2026-05-19 controversy A critical vulnerability was disclosed for the Ollama tool. 来源
- 2026-05-15 product_launch Ollama released version 0.25.0-rc0. 来源
- 2026-05-15 product_launch Guide released on setting up local AI dashboards with Ollama and LivChart. 来源
- 2026-05-15 product_launch Ollama launched version v0.24.0, which includes the new OpenAI Codex App. 来源
- 2026-05-14 product_launch Ollama released version 0.23.4 with new features and fixes. 来源
- 2026-05-11 product_launch Ollama released updates including a Web Search API, improved scheduling, and a preview of cloud model integration. 来源
- 2026-05-11 product_launch Ollama launched a new command, 'ollama launch', simplifying the setup for using AI coding tools like Claude Code with local or cloud models. 来源
- 2026-05-11 research_milestone Discovery of the critical "Bleeding Llama" vulnerability in Ollama. 来源
21 天有情绪数据
-
BrowserOS 发布开源浏览器,内置 AI 代理实现网页自动化
BrowserOS 已作为一款专为 AI 时代设计的开源浏览器发布,集成了 AI 代理,可通过自然语言命令自动执行网页任务。它优先考虑用户隐私,并通过支持 Anthropic Claude、Google Gemini 和 OpenAI 等热门选项以及本地模型在内的 11 家以上 AI 提供商来提供广泛的自定义。该浏览器基于 Chromium 分支构建,可确保与现有 Chrome 扩展程序的兼容性,并为普通用户和开发人员提供用户友好的体验。
-
Octelium 发布,成为安全访问和 AI 网关的 FOSS 替代方案
Octelium 发布了一个新的开源、自托管平台,旨在实现安全访问和部署。它作为一个统一的零信任解决方案,提供远程访问 VPN、ZTNA、ngrok 和 Cloudflare Tunnel 的替代方案、API 网关以及 AI 网关等功能。该平台支持基于身份的访问控制,可用于部署容器化应用程序和管理 homelab 基础设施。
-
Graft 和 FlexDraft 通过新的推测性解码方法提升 LLM 速度
两篇新研究论文 Graft 和 FlexDraft 引入了先进的推测性解码技术,以加速大型语言模型推理。Graft 结合了剪枝和检索,以填补剪枝分支留下的空白,在无需训练的情况下实现了显著的加速。FlexDraft 采用注意力调整和奖励引导校准,以灵活适应不同的批处理大小,缓解草稿验证不匹配问题并提高吞吐量。这些方法旨在通过允许以接近小型模型的速度提供高质量响应,来克服 LLM 部署中的延迟-成本陷阱。
-
AI 基础设施初创公司推出面向代理、DevOps、安全和医疗保健的工具
多家初创公司正在推出旨在改善基础设施和开发人员生产力的 AI 驱动工具。Trigger.dev 提供了一个用于构建可靠 AI 代理和工作流的开源平台,利用快照技术进行执行。Datafruit 提供了一个 AI DevOps 代理,可以审计云支出、检查安全策略并修改基础设施即代码。Gecko Security 使用 LLM 查找传统静态分析工具遗漏的代码中的复杂漏洞。
-
Gemma 3n 在开源生态系统中全面可用!
Google DeepMind 已全面发布 Gemma 3n,这是一款专为设备端应用设计的移动优先多模态模型。这种新架构支持图像、音频、视频和文本输入,以及文本输出,并针对效率进行了优化,提供有效参数为 2B 和 4B 的版本,模仿了传统 2B 和 4B 模型的内存占用。Gemma 3n 引入了 MatFormer 等新组件以提高灵活性,以及 Per Layer Embeddings 以提高内存效率,在多语言、数学、编码和推理方面取得…
-
CrewAI 库通过 LangChain 简化 AI 代理编排
CrewAI 是一个旨在简化多个 AI 代理的创建和编排的新库。它构建在 LangChain 之上,允许开发人员集成各种工具和 LLM,包括本地开源模型。该平台为旅行规划和股票分析等常见用例提供了模板,并与 Replit 集成以进行云部署,与 LangSmith 集成以进行代理运行调试。
-
Meta 的 Llama 2 超越开源 LLM 排行榜,支持商业用途
Meta 发布了 Llama 2,一个开源的大型语言模型,它迅速成为同级别模型中的最先进水平,性能超越了其他开源模型。该模型在 2 万亿个 token 上进行了预训练,具有更长的上下文长度,并在人类反馈强化学习方面进行了大量投入。Llama 2 可用于商业用途,满足了不能将敏感数据发送给外部 API 提供商的组织的关键需求,并为 GPT-4 等专有模型提供了替代方案。