DeepSeek 发布了其 V4 系列混合专家模型,包括 V4-Pro(总计 1.6T 参数)和 V4-Flash(总计 284B 参数)。这两个模型均采用 MIT 许可发布,提供完全的开源权重,并支持高达 100 万个 token 的上下文窗口。虽然 V4-Pro 在编码方面尤其表现出前沿级别的基准测试,但其庞大的规模使其适合数据中心部署,而 V4-Flash 则更易于本地使用。此次发布恰逢 DeepSeek 完成一轮巨额融资,据报道约为 70-100 亿美元,并承诺将继续发布开源模型。 AI
影响 以其前沿级别的性能和宽松的许可协议,为开源权重模型树立了新标杆,有望加速企业对自托管大型语言模型的采用。
排序理由 前沿实验室模型发布,包含系统卡和开源权重。[lever_c_降级自 frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →