DeepSeek 在发布其 V4 模型后,已将其 API 价格大幅下调高达 90%。该公司将此次创下行业新低的降价归因于其稀疏注意力架构。据报道,这种新架构降低了每个 token 的计算需求,并支持高达 100 万 token 的上下文窗口。 AI
影响 加速了人工智能推理成本下降的趋势,可能促进大上下文窗口模型的更广泛采用。
排序理由 重要人工智能实验室发布模型,伴随显著的价格下调和技术创新。
在 Mastodon — sigmoid.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →