PulseAugur
实时 18:39:29
English(EN) DeepSeek R2 just shipped: 32B dense transformer, 92.7% on AIME 2025, runs on a single RTX 4090. It costs ~70% less than GPT-5 for reasoning tasks. MIT licensed,

DeepSeek R2 发布 32B 模型,以更低成本在推理方面媲美 GPT-5

DeepSeek 发布了其 R2 模型,这是一个拥有 320 亿参数的密集 Transformer 模型。该新模型在 AIME 2025 基准测试中达到了 92.7% 的准确率,并且可以在单块 RTX 4090 显卡上运行。R2 模型还具有显著的成本效益,在推理任务上的成本比 GPT-5 低约 70%,并根据 MIT 许可提供自托管服务。 AI

影响 为推理任务提供了经济高效、高性能的替代方案,可能影响企业采用和研究。

排序理由 重要 AI 实验室发布新模型,基准性能强劲。

在 Mastodon — fosstodon.org 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Mastodon — fosstodon.org TIER_1 English(EN) · [email protected] ·

    DeepSeek R2 just shipped: 32B dense transformer, 92.7% on AIME 2025, runs on a single RTX 4090. It costs ~70% less than GPT-5 for reasoning tasks. MIT licensed,

    DeepSeek R2 just shipped: 32B dense transformer, 92.7% on AIME 2025, runs on a single RTX 4090. It costs ~70% less than GPT-5 for reasoning tasks. MIT licensed, self-hostable. Full developer guide — benchmarks, pricing, API access: https:// crazyrouter.com/en/blog/deepse ek-r2-re…