English(EN) Sample-Size Scaling of the African Languages NLI Evaluation

研究发现非洲语言自然语言推理表现随数据量变化

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-02 06:27

一项关于AfriXNLI基准测试的新研究表明，增加非洲语言的标记数据并不总是能提高自然语言推理（NLI）的表现。研究人员发现，数据量与表现之间的关系通常是非单调的，并且高度依赖于语言。一些语言在数据量增加时表现出平台期甚至下降，这凸显了创建对语言敏感的数据集和先进的多语言建模策略的必要性。 AI

影响挑战了数据越多模型表现就越好的假设，为低资源语言提出了细致的方法。

排序理由学术论文，详细介绍了新的评估和语言模型表现的发现。

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.CL TIER_1 English(EN) · Anuj Tiwari, Oluwapelumi Ogunremu, Terry Oko-odion, Jesujuwon Egbewale, Hannah Nwokocha · 2026-06-03 04:00

非洲语言自然语言推理评估的样本量缩放

arXiv:2606.03219v1 Announce Type: new Abstract: African languages have very little labelled data, and it is unclear if augmenting the quantity of annotation data reliably enhances downstream performance. The study is a systematic sample-size scaling study of natural language infe…
arXiv cs.CL TIER_1 English(EN) · Hannah Nwokocha · 2026-06-02 06:27

非洲语言自然语言推断评估的样本量缩放

African languages have very little labelled data, and it is unclear if augmenting the quantity of annotation data reliably enhances downstream performance. The study is a systematic sample-size scaling study of natural language inference (NLI) on 16 African languages based on the…