PulseAugur
实时 08:00:41
Deutsch(DE) DeepSeek-V4-Pro-DSpark ist ein Text-Generation-Modell mit MIT-Lizenz. Die Card nennt 1,6T Parameter, 49B aktivierte Parameter und einen Kontext von 1 Million To

DeepSeek 发布 V4-Flash 和 V4-Pro 模型,支持 1M 上下文

DeepSeek 发布了两款新的文本生成模型:DeepSeek-V4-Flash-DSparkDeepSeek-V4-Pro-DSpark。Flash 模型拥有 2840 亿参数,其中 130 亿激活,上下文窗口为 100 万 token。Pro 模型规模更大,拥有 1.6 万亿参数,其中 490 亿激活,同样支持 100 万 token 的上下文。 AI

影响 这些模型提供了大量的参数和广泛的上下文窗口,有可能在复杂的文本生成任务中提升能力。

排序理由 Frontier-lab 模型发布,带有系统卡 [lever_c_demoted from frontier_release: ic=2 ai=1.0]

在 Mastodon — mastodon.social 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

DeepSeek 发布 V4-Flash 和 V4-Pro 模型,支持 1M 上下文

报道来源 [2]

  1. Mastodon — mastodon.social TIER_1 Deutsch(DE) · aisyndicate ·

    DeepSeek-V4-Flash-DSpark is tagged as a text-generation model. The card mentions 284B parameters, 13B activated parameters, 1M context, and MIT license. https:// hu

    DeepSeek-V4-Flash-DSpark ist als text-generation Modell getaggt. Die Card nennt 284B Parameter, 13B aktivierte Parameter, 1M Kontext und MIT-Lizenz. https:// huggingface.co/deepseek-ai/Dee pSeek-V4-Flash-DSpark # KI # AI # LLM # AISyndicate

  2. Mastodon — mastodon.social TIER_1 Deutsch(DE) · aisyndicate ·

    DeepSeek-V4-Pro-DSpark is a text generation model with an MIT license. The card mentions 1.6T parameters, 49B activated parameters, and a context of 1 million tokens.

    DeepSeek-V4-Pro-DSpark ist ein Text-Generation-Modell mit MIT-Lizenz. Die Card nennt 1,6T Parameter, 49B aktivierte Parameter und einen Kontext von 1 Million Tokens. https:// huggingface.co/deepseek-ai/Dee pSeek-V4-Pro-DSpark # KI # AI # LLM # AISyndicate