Google 宣布其 Gemma 4 模型现已运行速度提高三倍,这得益于引入了 MTP drafters。此项增强功能使模型能够同时预测和输出多个 token,在保持输出质量和智能的同时显著提高了推理速度。此次更新侧重于改进模型推理性能。 AI
影响 更快的 AI 模型推理潜力可以加速 AI 应用的开发和部署。
排序理由 宣布现有模型的性能改进和新功能。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →