一项关于AfriXNLI基准测试的新研究表明,增加非洲语言的标记数据并不总是能提高自然语言推理(NLI)的表现。研究人员发现,数据量与表现之间的关系通常是非单调的,并且高度依赖于语言。一些语言在数据量增加时表现出平台期甚至下降,这凸显了创建对语言敏感的数据集和先进的多语言建模策略的必要性。 AI
影响 挑战了数据越多模型表现就越好的假设,为低资源语言提出了细致的方法。
排序理由 学术论文,详细介绍了新的评估和语言模型表现的发现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →