Google 发布了 Gemma 4 12B,这是一款新推出的多模态模型,它显著省略了传统的视觉和音频专用编码器。相反,它通过其仅解码器的 Transformer 主干直接处理这些输入,旨在降低延迟并简化架构。这款拥有 120 亿参数的模型设计用于在具有 16GB VRAM 的消费级硬件上运行,填补了 Gemma 4 系列中用于支持本地代理系统的能力空白。 AI
影响 这种新颖的架构可以降低本地代理系统的延迟并简化多模态 AI 开发。
排序理由 大型 AI 实验室发布的新模型,采用了新颖的架构方法。[lever_c_从 frontier_release 降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →