NVIDIA 推出了名为 Nemotron-Labs Diffusion 的新型扩散语言模型(DLM)系列,旨在克服传统自回归模型的局限性。这些 DLM 通过并行创建多个 token,然后进行迭代优化来生成文本,有望提高速度并能够修改之前的输出。该模型提供 3B、8B 和 14B 参数规模的版本,包括基础模型和指令微调的聊天模型变体,并包含一个视觉语言模型。 AI
影响 有望显著加快文本生成速度并提高修订能力,对延迟敏感的应用和开发人员工作流程产生影响。
排序理由 这是来自主要 AI 实验室 NVIDIA 的新模型发布,包含模型架构和可用性详情。[lever_c_demoted from frontier_release: ic=2 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →