Gemma 4-E2B 的演示和 WebGPU 内核已发布,可在浏览器中以大约每秒 255 个 token 的速度运行。据报道,在 Fable 5 关闭之前,Fable 5 协助完成了优化。此次发布包括在 Hugging Face 上提供的演示和内核,模型本身也已链接。 AI
影响 实现了 Gemma 4-E2B 更快、更便捷的浏览器内运行,可能提高了本地 LLM 用户的使用便利性。
排序理由 发布了现有模型的优化内核和演示,而非新模型发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →