DeepSeek 发布了其 R2 模型,这是一个拥有 320 亿参数的密集 Transformer 模型。该新模型在 AIME 2025 基准测试中达到了 92.7% 的准确率,并且可以在单块 RTX 4090 显卡上运行。R2 模型还具有显著的成本效益,在推理任务上的成本比 GPT-5 低约 70%,并根据 MIT 许可提供自托管服务。 AI
影响 为推理任务提供了经济高效、高性能的替代方案,可能影响企业采用和研究。
排序理由 重要 AI 实验室发布新模型,基准性能强劲。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →