PulseAugur
实时 15:41:56
实体 Hugging Face tokenizers crate

Hugging Face tokenizers crate

PulseAugur coverage of Hugging Face tokenizers crate — every cluster mentioning Hugging Face tokenizers crate across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_56687 ·

    Perplexity AI 开源 Rust 分词器,大幅降低 LLM 推理延迟

    Perplexity AI 已开源一个用 Rust 实现的新 Unigram 分词器,该分词器显著降低了 LLM 推理的延迟和 CPU 利用率。与 Hugging Face 的 tokenizers Crate 相比,这个新分词器实现了高达 5 倍的 p50 延迟降低,并在生产环境中将 CPU 使用量减少了 5-6 倍。该优化针对 XLM-RoBERTa 等常用于排名和检索任务的模型,通过解决影响小型模型和重排器延迟的分词瓶颈。