PulseAugur
实时 00:44:19
实体 Confident Adaptive Language Modeling

Confident Adaptive Language Modeling

PulseAugur coverage of Confident Adaptive Language Modeling — every cluster mentioning Confident Adaptive Language Modeling across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_112749 ·

    Google AI 通过新的多令牌预测方法加速设备端 LLM

    Google AI 开发了一种新方法来加速设备端大型语言模型(LLM),例如 Gemini Nano 和 Gemma,特别适用于 Google Pixel 手机。这种称为多令牌预测(MTP)的技术,将一个草稿头附加到现有的、冻结的模型上。这使得模型能够同时生成多个令牌,绕过了传统的逐个令牌的瓶颈,并在无需单独、内存密集型的草稿模型的情况下,显著提高了推理速度和能源效率。