DeepSeek-V4 Pro 是一个拥有 1.6 万亿参数的大型混合专家模型,现已在 Together AI 平台上可用。该模型专为长上下文推理而设计,在其最初的 Together AI 部署中支持高达 512K 令牌的上下文窗口,并计划支持 1M 令牌的上下文窗口。它具有可控的推理模式,可针对速度或深度进行优化,并为缓存的输入令牌提供专门的定价,以降低重复查询的成本。 AI
影响 支持需要对海量数据集进行推理的新应用,并可能降低重复长上下文查询的成本。
排序理由 这是在云平台上发布的一款具有先进长上下文能力的大规模模型的重要版本。[lever_c_demoted from significant: ic=1 ai=1.0]
- CorpusQA 1M
- DeepSeek
- DeepSeek V3.2
- DeepSeek V4 Flash
- DeepSeek-V4 Pro
- GPQA Diamond
- LiveCodeBench
- Mixture-of-Experts
- MRCR 1M
- SWE-bench Verified
- Together AI
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →