研究人员开发了一种名为ResLSTM-SA的新型轻量级架构,用于情感语音识别。该模型在LSTM框架内集成了残差连接和软注意力机制,与大型预训练模型相比,显著降低了计算和内存需求。在RAVDESS数据集上进行测试,ResLSTM-SA仅用46.8k参数就达到了0.6517的UAR,使其适用于边缘设备和实时语音助手的部署。 AI
影响 能够更有效地在边缘设备和实时语音助手上部署情感语音识别。
排序理由 该集群包含一篇详细介绍新模型架构的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →