PulseAugur
实时 19:46:52
English(EN) Balalaika: Data-Centric, Prosody-Aware Annotation Pipeline for Russian Speech

Balalaika 流程通过韵律感知标注增强俄语语音数据

研究人员开发了 Balalaika,一个开源流程,用于对俄语语音数据进行标注,重点关注韵律。该系统集成了语义语音活动检测、多 ASR 集成和自动质量过滤,创建了一个 5.1k 小时的语料库。该流程还通过标点、词重音和音素归一化来丰富文本,在语音去噪和文本到语音合成方面展示了一致的改进。 AI

影响 引入了一个处理和标注俄语语音数据的新流程,可能改进下游语音合成和去噪模型。

排序理由 这是一篇描述新的语音数据标注流程的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Balalaika 流程通过韵律感知标注增强俄语语音数据

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Kirill Borodin, Nikita Vasiliev, Vasiliy Kudryavtsev, Maxim Maslov, Mikhail Gorodnichev, Grach Mkrtchian ·

    Balalaika: Data-Centric, Prosody-Aware Annotation Pipeline for Russian Speech

    arXiv:2507.13563v2 Announce Type: replace Abstract: We introduce Balalaika, an open-source, data-centric pipeline for processing audio and producing prosody-aware annotations. It combines semantic VAD for context-preserving segmentation, multi-ASR ensembling with ROVER consensus …