DeepSeek 已在其 DeepSeek-V3.2-Exp 推理演示的早期版本中发现了一个导致性能下降的 bug。该问题源于 indexer 模块中 RoPE 实现的不匹配,早期版本期望非交错输入,而 MLA RoPE 期望交错输入。现已实施修复,可通过其 GitHub 存储库获取。 AI
影响 解决了推理演示中的一个特定 bug,提高了 DeepSeek-V3.2-Exp 用户的使用稳定性。
排序理由 识别了一个推理演示的特定 bug 修复,这是一项技术更新,而非重大发布或研究突破。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →