研究人员开发了一个新的古希腊语到现代希腊语翻译基准和数据集,这项任务以前因缺乏平行数据而受到阻碍。AG-MG平行语料库包含超过132,000个句子对,是通过一个涉及网络抓取、先进对齐技术以及使用Gemini 2.5 Flash进行的大型语言模型错误纠正的新颖流程创建的。实验表明,微调Llama-Krikri-8B和M2M100等模型可显著提高翻译质量,最佳模型的BLEU得分达到13.16。 AI
影响 推动了低资源语言的翻译,可能为历史语言学和数字人文领域带来新应用。
排序理由 该集群描述了一篇介绍特定机器翻译任务新基准和数据集的学术论文。
- AG-MG Parallel Corpus
- Ancient Greek
- Gemini 2.5 Flash
- Llama-Krikri-8B
- M2M100
- Modern Greek
- NLLB
- Spyridon Mavromatis
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →