PulseAugur
实时 00:40:26
中文(ZH) Redis之父下场,给DeepSeek V4单独造了一台推理引擎

Redis 创始人为 Mac 构建 DeepSeek V4 专用推理引擎

Redis 的创始人 Salvatore Sanfilippo 开发了一个名为 ds4.c 的新的、高度优化的推理引擎,专门用于 DeepSeek V4 Flash 模型。该引擎旨在 Apple Silicon Mac 上高效运行,利用 Metal 进行 GPU 加速。它采用了非对称量化和将 KV 缓存卸载到磁盘等技术,以实现大型模型的本地执行,甚至支持 OpenAIAnthropic API 兼容性,以便集成到代理中。 AI

影响 这个专用引擎可能为在消费级硬件上更高效地本地执行 AI 模型铺平道路。

排序理由 一位知名开发者为现有的开源模型创建了专用推理引擎。

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

Redis 创始人为 Mac 构建 DeepSeek V4 专用推理引擎

报道来源 [2]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · henry ·

    Redis 创始人出面,为 DeepSeek V4 构建专用推理引擎

    Mac上就能本地跑deepseek

  2. X — SemiAnalysis TIER_1 English(EN) · SemiAnalysis_ ·

    来自 @sgl_project 和 @radixark 团队的精彩工作,他们在 B200、B300 上优化 DeepSeek V4 推理,以及最近通过 4x 等交互式优化

    Amazing work from the @sgl_project and @radixark team for their work optimizing DeepSeek V4 inference on B200, B300, and the recent 4x iso-interactivity throughput improvements on GB300 by @ChengWan17! As @elonmusk said, The GB300 is the best AI computer, and software https://t.…