PulseAugur
实时 08:40:03
English(EN) EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting

更新的语料库EPIC-EuroParl-UdS助力翻译和口译研究

本文介绍了EPIC-EuroParl-UdS,这是一个欧洲议会演讲及其翻译/口译的更新语料库。该资源通过修正的元数据、改进的语言注释以及词语对齐和意外度指数等新层级进行了优化。它支持对语言变异的信息论方法、书面语和口语模式的比较以及翻译现象的分析等方面的研究。本文中的一项新研究验证了口语数据,并评估了GPT-2和机器翻译模型在预测口译中的填充词方面的表现。 AI

影响 为语言信息论方法的研究提供了更精炼的数据集,有望改进机器翻译和口译模型。

排序理由 该条目是一篇研究论文,详细介绍了新的语料库及其应用。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

更新的语料库EPIC-EuroParl-UdS助力翻译和口译研究

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Maria Kunilovskaya, Christina Pollkl\"asener ·

    EPIC-EuroParl-UdS:翻译和口译的信息论视角

    arXiv:2603.09785v3 Announce Type: replace Abstract: This paper introduces an updated and combined version of the bidirectional English-German EPIC-UdS (spoken) and EuroParl-UdS (written) corpora containing original European Parliament speeches as well as their translations and in…