研究人员推出了一种新颖的稀疏专家混合(Mixture-of-Experts)框架TF-MoE,旨在改进用于边缘设备的语音分离模型。该方法在时间和频率维度上使用动态专家专业化,从而在对推理成本影响极小的情况下增加模型容量。TF-MoE基于Conformer骨干网络构建,在低计算场景下表现出卓越的性能,在Libri2Mix等基准测试中优于BSRNN等现有方法,同时保持可比的计算效率。 AI
影响 该模型可以在资源受限的设备上实现更复杂的语音处理,扩展AI在移动和嵌入式应用中的能力。
排序理由 该集群包含一篇详细介绍新模型架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →