English(EN) Neural Grammatical Error Correction for Romanian

推出罗马尼亚语语法纠错语料库和Transformer模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了一个专门针对罗马尼亚语的语法纠错（GEC）新数据集和神经模型。这项工作解决了非英语语言中GEC资源稀缺的问题，因为现有工具往往有限。表现最好的模型通过在人工生成的数据上进行预训练，然后在新创建的罗马尼亚语GEC语料库上进行微调，达到了53.76的F0.5分数。 AI

影响为罗马尼亚语提供了一个新的GEC数据集和模型，有可能改进该语言的自然语言处理工具。

排序理由这是一篇研究论文，介绍了一个针对低资源语言特定自然语言处理任务的新数据集和模型。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Teodor-Mihai Cotet, Stefan Ruseti, Mihai Dascalu · 2026-04-28 04:00

面向罗马尼亚语的神经语法纠错

arXiv:2604.23627v1 Announce Type: new Abstract: Resources for Grammatical Error Correction (GEC) in non-English languages are scarce, while available spellcheckers in these languages are mostly limited to simple corrections and rules. In this paper we introduce a first GEC corpus…