PulseAugur
实时 18:55:02
English(EN) A Komi-Yazva--Russian Parallel Corpus and Evaluation Protocol for Zero- and Few-Shot LLM Translation

新语料库助力濒危科米-亚兹瓦语的LLM翻译

研究人员开发了一个新的平行语料库和评估协议,专门用于科米-亚兹瓦语和俄语之间的翻译,重点关注濒危和低资源语言。该数据集包含源自叙事文本的457个句子对,旨在促进对大型语言模型进行防泄露评估。使用此设置进行的实验表明,虽然LLM可以产生有意义的翻译,但性能因模型和提示策略而异,少样本提示比零样本提示显示出持续的改进。 AI

影响 为评估LLM在极低资源语言场景下的翻译能力提供了一个新的基准和数据集。

排序理由 该集群包含一篇学术论文,详细介绍了用于LLM翻译的新数据集和评估协议。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Petr Parshakov ·

    一个科米-亚兹瓦语-俄语平行语料库及用于零样本和少样本大型语言模型翻译的评估协议

    arXiv:2606.06420v1 Announce Type: new Abstract: We present the first Komi-Yazva--Russian parallel corpus together with an explicit evaluation protocol for studying LLM translation in an endangered, extremely low-resource setting. The dataset contains 457 aligned sentence pairs fr…

  2. arXiv cs.CL TIER_1 English(EN) · Petr Parshakov ·

    一个科米-亚兹瓦语-俄语平行语料库及用于零样本和少样本大型语言模型翻译的评估协议

    We present the first Komi-Yazva--Russian parallel corpus together with an explicit evaluation protocol for studying LLM translation in an endangered, extremely low-resource setting. The dataset contains 457 aligned sentence pairs from 74 narrative texts and is accompanied by docu…