English(EN) Tokenizer Fertility and Zero-Shot Performance of Foundation Models on Ukrainian Legal Text: A Comparative Study

NVIDIA Nemotron 在乌克兰法律文本上超越 Mistral Large

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-14 14:35

一项新的研究在乌克兰法律文本上对七个基础模型进行了基准测试，揭示了分词器效率和零样本性能的显著差异。研究发现，Qwen3 模型在分词效率方面比 Llama 系列模型低 60%，影响了 API 成本。尽管参数量较少且成本较低，NVIDIA 的 Nemotron Super 3 (120B) 在性能上超越了 Mistral Large，并且少样本提示（few-shot prompting）在此语言上会降低性能。 AI

影响强调了分词器效率和零样本性能对于专业法律领域的重要性，可能指导从业者选择模型。

排序理由该集群包含一篇学术论文，详细介绍了在特定领域和语言上对基础模型进行的比较研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

NVIDIA Nemotron 在乌克兰法律文本上超越 Mistral Large

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Volodymyr Ovcharov · 2026-05-14 14:35

基础模型在乌克兰法律文本上的分词器生育力和零样本性能：一项比较研究

Foundation models tokenize Ukrainian legal text with vastly different efficiency, yet no systematic comparison exists for this domain. We benchmark seven models from five providers on 273 validated court decisions from Ukraine's state registry (EDRSR), measuring tokenizer fertili…

报道来源 [1]

基础模型在乌克兰法律文本上的分词器生育力和零样本性能：一项比较研究

相关实体

相关话题