Google DeepMind 发布了 DiffusionGemma,这是一个实验性的开源模型,旨在实现快速文本生成。与逐个 token 生成文本的传统模型不同,DiffusionGemma 可以并行生成多个 token,显著加快了输出速度。NVIDIA 已对该模型进行了优化,使其能在包括 GeForce RTX、RTX PRO 和 DGX Spark 系统在内的 GPU 上高效运行,从而实现更快的本地 AI 应用。 AI
影响 通过提高文本生成延迟,实现更快的本地 AI 应用和交互式代理工作流。
排序理由 Google DeepMind 发布了一个新的实验性模型 DiffusionGemma,并提供了其架构和性能的详细信息。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- DiffusionGemma
- Gemma 4
- Google DeepMind
- Hugging Face Transformers
- NVIDIA
- NVIDIA DGX Spark
- NVIDIA DGX Station
- NVIDIA GeForce RTX GPUs
- Unsloth
- vLLM
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →