DeepSeek 发布了两款新的文本生成模型:DeepSeek-V4-Flash-DSpark 和 DeepSeek-V4-Pro-DSpark。Flash 模型拥有 2840 亿参数,其中 130 亿激活,上下文窗口为 100 万 token。Pro 模型规模更大,拥有 1.6 万亿参数,其中 490 亿激活,同样支持 100 万 token 的上下文。 AI
影响 这些模型提供了大量的参数和广泛的上下文窗口,有可能在复杂的文本生成任务中提升能力。
排序理由 Frontier-lab 模型发布,带有系统卡 [lever_c_demoted from frontier_release: ic=2 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →