English(EN) wav2VOT: Automatic estimation of voice onset time, closure duration, and burst realisation with wav2vec2

wav2VOT工具使用wav2vec2进行自动语音学标注

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了wav2VOT，一个利用wav2vec2大型语音模型自动估计发音起始时间、闭合时长和爆破音实现等语音学特征的新工具。该工具在新数据集上的表现与现有方法相当，并且通过微调可以达到高精度。研究结果表明，大型语音模型能够生成精确的语音学标注，鼓励其在语音学研究中进一步应用。 AI

影响这项研究展示了大型语音模型在专业语音学标注任务中的实用性，有望简化研究流程。

排序理由学术论文，详细介绍了一种使用大型语音模型进行语音学标注的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · James Tanner, Morgan Sonderegger, Jane Stuart-Smith, Tyler Kendall, Jeff Mielke · 2026-06-30 04:00

wav2VOT: Automatic estimation of voice onset time, closure duration, and burst realisation with wav2vec2

arXiv:2606.28857v1 Announce Type: cross Abstract: While automatic tools for speech annotation are now commonplace within phonetic research pipelines, many tasks require substantial manual correction or training sets to perform accurately. Simultaneously, large speech models such …