实体
Quantization-Aware Training (QAT)
Quantization-Aware Training (QAT)
PulseAugur coverage of Quantization-Aware Training (QAT) — every cluster mentioning Quantization-Aware Training (QAT) across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Local LLM Speed Boosted by Gemma 4 MTP and QAT
A recent update to the "Run LLMs Locally" project has introduced Multi-Token-Prediction (MTP) for Gemma models, achieving speed improvements of up to 90% in token generation. This optimization, combined with Quantizatio…
-
Google 发布 Gemma 4 QAT 检查点,加速设备端 AI
Google 发布了其 Gemma 4 模型的量化感知训练 (QAT) 检查点,显著减小了内存占用并提高了在消费级硬件上的推理速度。与先前版本相比,这些新检查点速度可提升一倍,内存使用量减少约一半,同时质量损失极小。这一进步使得开发者能够更方便地在笔记本电脑和智能手机等设备上本地运行功能强大的开放权重模型,标志着更易于访问的设备端 AI 的发展方向。