Redis 的创始人 Salvatore Sanfilippo 开发了一个名为 ds4.c 的新的、高度优化的推理引擎,专门用于 DeepSeek V4 Flash 模型。该引擎旨在 Apple Silicon Mac 上高效运行,利用 Metal 进行 GPU 加速。它采用了非对称量化和将 KV 缓存卸载到磁盘等技术,以实现大型模型的本地执行,甚至支持 OpenAI 和 Anthropic API 兼容性,以便集成到代理中。 AI
影响 这个专用引擎可能为在消费级硬件上更高效地本地执行 AI 模型铺平道路。
排序理由 一位知名开发者为现有的开源模型创建了专用推理引擎。
- Anthropic
- Apple Silicon
- Claude Code
- DeepSeek V4 Flash
- ds4.c
- GPT 5.5
- MacBook Pro M3 Max
- Mac Studio M3 Ultra
- Metal
- OpenAI
- Redis
- Salvatore Sanfilippo
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →