开发了一个名为quicktok的新C++分词器,与现有解决方案相比,它提供了显著的速度提升。它实现了与tiktoken字节相同的分词,并且速度明显更快,比bpe-openai快2-3.6倍,比tiktoken本身快4-11倍。该分词器支持cl100k、o200k、GPT-OSS、Llama-3和Qwen2.5/3等多种模型,利用数据结构工程来提高性能。 AI
影响 加速分词工作流程,可能加快LLM推理和训练过程。
排序理由 该集群描述了一个针对特定AI任务(分词)的新开源软件发布,并附有基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →