Google发布了DiffusionGemma,一个拥有260亿参数的新型MoE模型,它利用扩散模型进行文本生成,速度比传统的自回归模型快四倍。这种方法并行处理token,类似于图像生成,从而实现更快的推理和更低的内存需求,使其可以在4090 GPU等消费级硬件上本地执行。虽然DiffusionGemma在速度和双向注意力带来的自纠正能力方面表现出色,但目前在质量上落后于标准的Gemma模型,将其定位为面向速度敏感型应用的实验性模型。 AI
影响 加速文本生成速度,并支持本地LLM部署,可能改变推理范式。
排序理由 来自主要前沿实验室(Google)的新模型发布,具有新颖的架构。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- 4090
- Claude
- DiffusionGemma
- Gemini
- Gemma
- Hugging Face
- Inception Labs
- Mercury 2
- NVIDIA
- RTX 5090
- Sundar Pichai
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →