研究人员开发了一种新的方法来评估和保留英语到中文语音到语音翻译(S2ST)中的词重音。他们创建了一个带重音标注的中文数据集和一个使用XLS-R的普通话重音检测器,并将其与英文EmphAssess系统集成,提出了一个新的跨语言重音评估客观指标。经过微调的CosyVoice3系统在保持翻译质量的同时,展示了改进的重音翻译能力,并且新的评估指标与人类判断显示出很强的相关性。 AI
影响 这项研究可以提高语音到语音翻译系统的自然度和表现力。
排序理由 该集群包含一篇详细介绍语音到语音翻译新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- arXiv
- CosyVoice3
- EmphAssess
- English
- Standard Chinese
- XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →