研究人员开发了一个新的基准和并行语料库,以改进阿拉伯语-俄语科学翻译。该基准包含约 27,000 个句子对,这些句子对是从科学摘要和一般文本中汇编而成的。使用 LoRA 技术对 Qwen2.5-7B-Instruct 等多语言语言模型进行微调,显著提高了翻译质量,证明了领域特定微调相对于少样本提示的必要性。 AI
影响 这项工作促进了阿拉伯语和俄语科学界之间的知识交流,有可能加速研究合作和创新。
排序理由 该集群描述了一篇新的学术论文,该论文提出了一个特定语言对的平行语料库和基准,以及经过微调的模型。
- Arabic
- arXiv
- Hugging Face
- LoRA
- mT5-base
- Mullosharaf Arabov Am
- NLLB-200-distilled-1.3B
- QLoRA
- Qwen2.5-7B-Instruct
- Russian
- Sustainable Development Goal 9
- UN SDG 17
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →