研究人员开发了一种新颖的双分支脉冲神经网络架构,称为 GSU-DBNet,旨在增强语音处理。该架构利用门控脉冲单元 (GSU) 同时模拟语音的幅度和复数频谱,并预测相应的频谱掩码。实验表明,GSU-DBNet 在参数量远少于可比的 ANN 模型的情况下,实现了更高的 PESQ 分数,表明其能效和性能均有所提高。 AI
影响 这项研究引入了一种参数效率更高的语音增强架构,有望在音频处理领域实现更节能的 AI 应用。
排序理由 该集群包含一篇详细介绍新型语音增强神经网络架构的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →