Google DeepMind 发布 DiffusionGemma 26B 多模态模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-11 03:28

Google DeepMind 发布了 DiffusionGemma 26B A4B IT，这是一个开源的多模态生成模型，能够处理文本、图像和视频输入以生成文本输出。该模型基于 Gemma 4 26B A4B Mixture-of-Experts 架构构建，拥有 252 亿个总参数和 38 亿个激活参数。它支持 256K token 的上下文窗口，跨 35 种以上语言的多语言推理，并且可以在 NVIDIA H100 GPU 上每秒生成超过 1,100 个 token。 AI

影响通过支持文本、图像和视频输入的开源模型，加速了多模态 AI 的发展。

排序理由这是来自前沿实验室（Google DeepMind）的新模型发布。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Google DeepMind 发布 DiffusionGemma 26B 多模态模型

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/pmttyji · 2026-06-11 03:28

nvidia/diffusiongemma-26B-A4B-it-NVFP4 · Hugging Face

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u2np0a/nvidiadiffusiongemma26ba4bitnvfp4_hugging_face/"> <img alt="nvidia/diffusiongemma-26B-A4B-it-NVFP4 · Hugging Face" src="https://external-preview.redd.it/9EBAZR2owX7nOGzlCDPXd-p_xWnW0WyWy3qPB046G1s.png?…

报道来源 [1]

nvidia/diffusiongemma-26B-A4B-it-NVFP4 · Hugging Face

相关实体

相关话题