PulseAugur
实时 12:13:06
English(EN) PiDA: Phonetically-Informed Data Augmentation for Robust Vietnamese Speech Translation

新技术提高越南语语音翻译准确性

研究人员开发了一种名为音素感知数据增强(PiDA)的新数据增强技术,以改进越南语语音翻译。该方法通过生成基于音素混淆的类ASR(自动语音识别)的损坏来解决级联语音翻译系统中的错误传播问题。在FLEURS越南语-英语数据集上使用PiDA进行微调,提高了对错误ASR输出的翻译准确性,BLEU分数显著提高。 AI

影响 提高语音翻译系统对ASR错误的鲁棒性,可能增强在嘈杂环境中的可用性。

排序理由 该集群包含一篇详细介绍语音翻译新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Giang Son Nguyen, Tung X. Nguyen, Hieu Minh Truong, Nhu Vo, Wray Buntine, Dung D. Le ·

    PiDA: Phonetically-Informed Data Augmentation for Robust Vietnamese Speech Translation

    arXiv:2606.12911v1 Announce Type: new Abstract: Cascaded speech translation (ST) systems suffer from error propagation when Automatic Speech Recognition (ASR) outputs incorrect transcripts. We present the first systematic categorization of ASR errors for Vietnamese ST, classifyin…

  2. arXiv cs.CL TIER_1 English(EN) · Dung D. Le ·

    PiDA: Phonetically-Informed Data Augmentation for Robust Vietnamese Speech Translation

    Cascaded speech translation (ST) systems suffer from error propagation when Automatic Speech Recognition (ASR) outputs incorrect transcripts. We present the first systematic categorization of ASR errors for Vietnamese ST, classifying substitution errors by phonetic cause and quan…