PulseAugur
实时 05:50:30
实体 Sarvam-1

Sarvam-1

PulseAugur coverage of Sarvam-1 — every cluster mentioning Sarvam-1 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58838 ·

    新的BrahmicTokenizer-131K提高了印度语言分词效率

    研究人员开发了BrahmicTokenizer-131K,这是一种旨在提高印度语言效率的新分词器,同时保持在英语和代码上的性能。与Mistral-Nemo Tekken/Sarvam-m等现有模型相比,该分词器在印度语言预训练文本上的分词数量减少了26.7%,在奥里亚语等语言上取得了显著的进步。BrahmicTokenizer-131K是OpenAI的o200k_base的即插即用替代品,在英语分词能力上具有竞争力,并在编码和数学基准…