Google DeepMind 发布了 DiffusionGemma 26B A4B IT,这是一个开源的多模态生成模型,能够处理文本、图像和视频输入以生成文本输出。该模型基于 Gemma 4 26B A4B Mixture-of-Experts 架构构建,拥有 252 亿个总参数和 38 亿个激活参数。它支持 256K token 的上下文窗口,跨 35 种以上语言的多语言推理,并且可以在 NVIDIA H100 GPU 上每秒生成超过 1,100 个 token。 AI
影响 通过支持文本、图像和视频输入的开源模型,加速了多模态 AI 的发展。
排序理由 这是来自前沿实验室(Google DeepMind)的新模型发布。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →