实体
Wav2Vec2-XLS-R
Wav2Vec2-XLS-R
PulseAugur coverage of Wav2Vec2-XLS-R — every cluster mentioning Wav2Vec2-XLS-R across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
-
Researchers explore supervised contrastive learning for deepfake audio detection
Researchers have explored supervised contrastive learning techniques to improve deepfake audio detection. Their study focused on varying similarity metrics, such as cosine and angular similarity, and different methods f…
-
新基准评估六维度的印度语言TTS口音保真度
研究人员推出PSP,一个旨在评估印度语言文本到语音(TTS)系统口音准确性的新基准。与关注清晰度和自然度的现有指标不同,PSP通过将其分解为六个不同的维度来专门衡量口音,包括卷舌音合并和韵律特征发散。对ElevenLabs v3和Sarvam Bulbul等系统的初步测试显示,在词错误率方面表现最佳的系统不一定在口音保真度方面表现出色,这凸显了对更细致评估方法的需求。