PulseAugur
实时 10:58:46
English(EN) Towards Robust Arabic Speech Emotion Recognition with Deep Learning

CNN-Transformer 将阿拉伯语语音情感识别准确率提升至 98.1%

研究人员开发了一个新的深度学习框架,以改进阿拉伯语语音情感识别,这项任务因方言多样性和有限的数据集而历来具有挑战性。该研究比较了三种架构:CNN-LSTM、CNN-Transformer 和微调的 wav2vec 2.0 模型。实验表明,CNN-Transformer 架构实现了 98.1% 的准确率,通过有效结合频谱特征提取和全局上下文建模,优于其他模型。 AI

影响 提高了低资源语言领域的准确性,可能为跨文化人工智能带来新应用。

排序理由 学术论文,详细介绍了新的模型架构和基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Youcef Soufiane Gheffari, Samiya Silarbi ·

    Towards Robust Arabic Speech Emotion Recognition with Deep Learning

    arXiv:2606.10278v1 Announce Type: cross Abstract: Speech Emotion Recognition (SER) aims to identify a speaker's emotional state from audio signals. While recent advances in deep learning have significantly improved SER performance in Indo-European languages, Arabic SER remains un…