PulseAugur
实时 15:42:25
实体 XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale

XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale

PulseAugur coverage of XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale — every cluster mentioning XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_15484 ·

    研究人员探索量子和深度学习在音频深度伪造检测中的应用

    提交给2026年环境感知语音和声音深度伪造检测挑战赛(ESDD2)的两篇研究论文提出了新颖的深度学习框架,用于检测经过篡操纵的音频。第一篇论文介绍了一个双分支系统,使用预训练模型XLS-R和BEATs分别分析语音和环境声音,达到了70.20%的F1分数。第二篇论文探讨了各种深度学习架构和预训练模型,发现使用三阶段策略对WavLM进行微调可获得更优异的结果,在一个基准数据集上取得了0.95的F1分数。