English(EN) Towards Robust Arabic Speech Emotion Recognition with Deep Learning

CNN-Transformer 将阿拉伯语语音情感识别准确率提升至 98.1%

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-10 04:00

研究人员开发了一个新的深度学习框架，以改进阿拉伯语语音情感识别，这项任务因方言多样性和有限的数据集而历来具有挑战性。该研究比较了三种架构：CNN-LSTM、CNN-Transformer 和微调的 wav2vec 2.0 模型。实验表明，CNN-Transformer 架构实现了 98.1% 的准确率，通过有效结合频谱特征提取和全局上下文建模，优于其他模型。 AI

影响提高了低资源语言领域的准确性，可能为跨文化人工智能带来新应用。

排序理由学术论文，详细介绍了新的模型架构和基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Youcef Soufiane Gheffari, Samiya Silarbi · 2026-06-10 04:00

Towards Robust Arabic Speech Emotion Recognition with Deep Learning

arXiv:2606.10278v1 Announce Type: cross Abstract: Speech Emotion Recognition (SER) aims to identify a speaker's emotional state from audio signals. While recent advances in deep learning have significantly improved SER performance in Indo-European languages, Arabic SER remains un…

报道来源 [1]

Towards Robust Arabic Speech Emotion Recognition with Deep Learning

相关实体

相关话题