Google DeepMind 已全面发布 Gemma 3n,这是一款专为设备端应用设计的移动优先多模态模型。这种新架构支持图像、音频、视频和文本输入,以及文本输出,并针对效率进行了优化,提供有效参数为 2B 和 4B 的版本,模仿了传统 2B 和 4B 模型的内存占用。Gemma 3n 引入了 MatFormer 等新组件以提高灵活性,以及 Per Layer Embeddings 以提高内存效率,在多语言、数学、编码和推理方面取得了强劲的性能,其中 E4B 版本在 LMArena 基准测试中超过了 1300。该模型可通过流行的开发者工具获得,并与不断增长的 Gemmaverse 生态系统集成。 AI
排序理由 Google DeepMind 发布了 Gemma 3n,这是一款具有新颖架构和强大基准性能的设备端应用多模态模型。
- Gemini 2.0
- Gemma
- Gemma 3n
- Gemmaverse
- Google AI Edge
- Google DeepMind
- Hugging Face Transformers
- Institute of Science Tokyo
- LAuReL
- llama.cpp
- MatFormer
- MobileNet-v5
- Ollama
- Per Layer Embeddings
- Roboflow
- ShieldGemma 2
- MLX
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →