PulseAugur
实时 13:50:52
实体 UIT-ViMD

UIT-ViMD

PulseAugur coverage of UIT-ViMD — every cluster mentioning UIT-ViMD across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_56299 ·

    新的越南语语音识别系统采用基于音素的音节建模

    研究人员为越南语语音识别(ASR)系统开发了一种新颖的音节结构解码器。这种新方法在音素层面建模语音,显式地捕捉音节的音理构成,而不是依赖于字符或单词等书写单位。该系统在越南语语音基准 LSVSC 和 UIT-ViMD 上均表现出优越性能,尽管使用了明显更小的词汇量且没有额外的训练资源,但其性能优于 PhoWhisper 和 Wav2Vec2 等强大的基线模型。

  2. TOOL · CL_51233 ·

    越南语语音模型捕捉方言语音变体

    研究人员开发了一个新的框架来模拟越南语在不同地区之间的语音学变异。与先前假设拼写到发音映射不随方言变化的旧方法不同,这种方法在词汇和解码阶段都明确考虑了方言差异。所提出的系统使用一种语音学词汇,将音节分解为结构化组件,并将其映射到特定方言的国际音标(IPA)表示,以更少的参数和无需外部预训练即可实现强大的性能。