NVIDIA 推出了 Nemotron-TwoTower-30B-A3B-Base-BF16,一个新颖的、基于扩散的语言模型。该模型通过使用扩散去噪器塔来同时处理 token 块,从而偏离了传统的逐 token 生成方式。NVIDIA 报告称,这种方法在保持与其自回归模型几乎同等质量的同时,显著提高了生成速度。 AI
影响 这种新颖的基于扩散的方法可以提高 LLM 的生成速度,同时保持高质量。
排序理由 NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,一个基于 Nemotron 3 Nano 30B-A3B 主干的、不同寻常的、基于扩散的语言模型。 [lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →