PulseAugur
实时 15:25:18
English(EN) Neural Machine Translation for Low-Resource Tangkhul--English

新型AI模型解决低资源唐库尔语-英语翻译问题

研究人员为低资源的唐库尔语-英语语言对开发了两个神经机器翻译系统。主要系统利用在超过38,000个平行句子上微调的ByT5-large模型,取得了39.97的BLEU分数。同时还训练了一个次要的mT5-small系统进行比较。该研究强调了与唐库尔语拼写法和训练数据的领域偏差相关的挑战,并建议未来的工作应侧重于数据多样化和领域适应。 AI

影响 推动了对资源匮乏语言的机器翻译能力,可能带来新的沟通和信息获取方式。

排序理由 该集群包含一篇详细介绍机器翻译新研究成果的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新型AI模型解决低资源唐库尔语-英语翻译问题

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Chormi Zimik Vashai, Agniva Maiti ·

    Neural Machine Translation for Low-Resource Tangkhul--English

    arXiv:2606.25365v1 Announce Type: new Abstract: We present a study on low-resource machine translation for the Tangkhul-English (nmf-en) language pair. Tangkhul is a severely under-resourced Tibeto-Burman language spoken primarily in Manipur, India, with virtually no prior natura…

  2. arXiv cs.CL TIER_1 English(EN) · Agniva Maiti ·

    Neural Machine Translation for Low-Resource Tangkhul--English

    We present a study on low-resource machine translation for the Tangkhul-English (nmf-en) language pair. Tangkhul is a severely under-resourced Tibeto-Burman language spoken primarily in Manipur, India, with virtually no prior natural language processing infrastructure. We describ…