实体 XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale

XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale

PulseAugur coverage of XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale — every cluster mentioning XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_15484 · May 5 · 04:00

研究人员探索量子和深度学习在音频深度伪造检测中的应用

提交给2026年环境感知语音和声音深度伪造检测挑战赛（ESDD2）的两篇研究论文提出了新颖的深度学习框架，用于检测经过篡操纵的音频。第一篇论文介绍了一个双分支系统，使用预训练模型XLS-R和BEATs分别分析语音和环境声音，达到了70.20%的F1分数。第二篇论文探讨了各种深度学习架构和预训练模型，发现使用三阶段策略对WavLM进行微调可获得更优异的结果，在一个基准数据集上取得了0.95的F1分数。

研究人员探索量子和深度学习在音频深度伪造检测中的应用