研究人员推出 MeCo,一种新颖的一步生成式校正器,用于多通道语音分离。该方法使用基于均值流的方法将估计的音频直接映射到干净的语音,旨在提高人类听觉质量,超越传统的判别模型。MeCo 结合了数据空间优化和 $\mathbf{x}_r$-loss 以及端点 SI-SDR loss,以增强信号保真度和主观听觉体验。 AI
影响 提高语音分离任务的音频处理质量和效率。
排序理由 这是一篇描述语音分离新方法的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →