PulseAugur
实时 08:06:51

Google DeepMind 发布 DiffusionGemma 26B 多模态模型

Google DeepMind 发布了 DiffusionGemma 26B A4B IT,这是一个开源的多模态生成模型,能够处理文本、图像和视频输入以生成文本输出。该模型基于 Gemma 4 26B A4B Mixture-of-Experts 架构构建,拥有 252 亿个总参数和 38 亿个激活参数。它支持 256K token 的上下文窗口,跨 35 种以上语言的多语言推理,并且可以在 NVIDIA H100 GPU 上每秒生成超过 1,100 个 token。 AI

影响 通过支持文本、图像和视频输入的开源模型,加速了多模态 AI 的发展。

排序理由 这是来自前沿实验室(Google DeepMind)的新模型发布。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Google DeepMind 发布 DiffusionGemma 26B 多模态模型

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/pmttyji ·

    nvidia/diffusiongemma-26B-A4B-it-NVFP4 · Hugging Face

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u2np0a/nvidiadiffusiongemma26ba4bitnvfp4_hugging_face/"> <img alt="nvidia/diffusiongemma-26B-A4B-it-NVFP4 · Hugging Face" src="https://external-preview.redd.it/9EBAZR2owX7nOGzlCDPXd-p_xWnW0WyWy3qPB046G1s.png?…