研究人员开发了 CodecSep,一个在神经音频编解码器潜在空间中直接操作的、用于基于提示的声源分离的新框架。与现有方法相比,这种方法能够以显著降低的计算成本实现开放词汇的声源分离。CodecSep 集成了冻结的 DAC 主干和一个轻量级的 Transformer masker,能够在边缘设备和编解码器传输管道中实现高效、低延迟的部署。 AI
影响 在边缘设备和实时传输中实现更高效、更灵活的音频编辑和声源提取。
排序理由 这是一篇详细介绍新音频处理框架的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →