PulseAugur
实时 23:01:59
English(EN) Bridging Scientific Heritage: An Arabic--Russian Parallel Corpus and LLM Benchmark for Sustainable Knowledge Transfer

新的阿拉伯语-俄语平行语料库和基准改进科学翻译

研究人员开发了一个新的基准和并行语料库,以改进阿拉伯语-俄语科学翻译。该基准包含约 27,000 个句子对,这些句子对是从科学摘要和一般文本中汇编而成的。使用 LoRA 技术对 Qwen2.5-7B-Instruct 等多语言语言模型进行微调,显著提高了翻译质量,证明了领域特定微调相对于少样本提示的必要性。 AI

影响 这项工作促进了阿拉伯语和俄语科学界之间的知识交流,有可能加速研究合作和创新。

排序理由 该集群描述了一篇新的学术论文,该论文提出了一个特定语言对的平行语料库和基准,以及经过微调的模型。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的阿拉伯语-俄语平行语料库和基准改进科学翻译

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · M. K. Arabov ·

    连接科学遗产:一个阿拉伯-俄语平行语料库和用于可持续知识转移的大型语言模型基准

    arXiv:2606.30943v1 Announce Type: new Abstract: Russian and Arabic are among the major languages of scientific communication. Language barriers impede the exchange of research results between these communities, which affects international collaboration and the progress of sustain…

  2. arXiv cs.CL TIER_1 English(EN) · M. K. Arabov ·

    连接科学遗产:一个阿拉伯-俄语平行语料库和用于可持续知识转移的大型语言模型基准

    Russian and Arabic are among the major languages of scientific communication. Language barriers impede the exchange of research results between these communities, which affects international collaboration and the progress of sustainability-related research. We present a benchmark…