Google DeepMind 发布了 DiffusionGemma,这是一个实验性的开放模型,它以并行块而非逐个 token 的方式生成文本。这种新颖的方法在专用 GPU 上可实现高达四倍的输出速度,从而能够进行实时自我纠正和复杂的格式设置。该模型基于 Gemma 4 架构,采用具有 260 亿参数的专家混合(Mixture of Experts)设计,在推理过程中激活约 38 亿参数。 AI
影响 通过实现并行处理和自我纠正来加速文本生成任务,可能影响内容创作和复杂数据分析。
排序理由 前沿实验室模型发布,附带系统卡。
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →