DeepSeek 推出了其 V3.2 模型,集成了 DeepSeek Sparse Attention (DSA)。这项创新将注意力复杂度从 O(L²) 降低到 O(Lk),显著提高了长上下文处理的效率。该模型的架构还利用了 Lightning Indexer 以获得进一步的性能提升。 AI
影响 提高了长上下文处理的效率,可能支持新的应用。
排序理由 发布了具有新颖注意力机制的新模型版本。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →