一个名为 AfriScience-MT 的新平行语料库已被开发出来,以解决六种非洲语言(阿姆哈拉语、豪萨语、卢干达语、北部索托语、约鲁巴语和祖鲁语)在科学术语方面存在的不足。该语料库由专业翻译和科学传播者创建,涵盖 11 个科学领域,旨在实现非洲科学传播的去殖民化。对机器翻译系统和大型语言模型的基准测试显示,GPT-5.4 和 Gemini-3.1-Flash-Lite 等闭源模型优于开源模型,其中 NLLB-1.3B 在微调后表现最佳。 AI
影响 该语料库及其基准测试有望加速低资源语言翻译的研究,并提高人工智能在非洲各科学领域的普及程度。
排序理由 该集群描述了一篇介绍平行语料库和基准测试机器翻译系统的新学术论文。
- AfriScience-MT
- Amharic
- Gemini-3.1-Flash-Lite
- GPT-5.4
- Hausa
- Luganda
- NLLB-1.3B
- Northern Sotho
- TranslateGemma-12B
- Yorùbá
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →