OpenAI 与 Broadcom 合作开发了代号为 Jalapeño 的定制推理芯片,专为高效运行 LLM 而设计。此举旨在减少对 NVIDIA 的依赖,并可能降低 API 成本,计划于 2026 年大规模部署。同时,DeepSeek 发布了 DSpark,一个开源的推测解码框架,可在不影响质量的情况下显著提高其 V4 模型的推理速度,解决了用户体验问题。此外,还观察到一种现象,即由于上下文窗口饱和和热节流等因素,本地 LLM 在长时间使用后性能会下降。 AI
影响 OpenAI 的定制芯片可能会重塑 LLM 部署的经济性,而 DeepSeek 的优化框架为现有模型提供了即时的推理速度提升。
排序理由 该集群涵盖了多项重要的 AI 行业发展,包括定制芯片开发、推理优化以及本地 LLM 观察到的性能下降。 [lever_c_demoted from significant: ic=1 ai=1.0]
- Anthropic
- Broadcom
- DeepSeek
- DeepSeek V4
- DSpark
- GPT-5.3-Codex-Spark
- Greg Brockman
- H100s
- HP Inc.
- jalapeño
- Microsoft
- NVIDIA
- OpenAI
- Shopify
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →