Google 发布了其 Gemma 4 模型的量化感知训练 (QAT) 检查点,显著减小了内存占用并提高了在消费级硬件上的推理速度。与先前版本相比,这些新检查点速度可提升一倍,内存使用量减少约一半,同时质量损失极小。这一进步使得开发者能够更方便地在笔记本电脑和智能手机等设备上本地运行功能强大的开放权重模型,标志着更易于访问的设备端 AI 的发展方向。 AI
影响 使更强大的 AI 模型能够在消费设备上高效运行,加速本地 AI 应用的开发。
排序理由 发布具有显著设备端部署性能改进的新模型检查点。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →