English(EN) CodecSep: Prompt-Driven Universal Sound Separation on Neural Audio Codec Latents

CodecSep 在神经音频编解码器潜在空间中实现基于提示的声源分离

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员开发了 CodecSep，一个在神经音频编解码器潜在空间中直接操作的、用于基于提示的声源分离的新框架。与现有方法相比，这种方法能够以显著降低的计算成本实现开放词汇的声源分离。CodecSep 集成了冻结的 DAC 主干和一个轻量级的 Transformer masker，能够在边缘设备和编解码器传输管道中实现高效、低延迟的部署。 AI

影响在边缘设备和实时传输中实现更高效、更灵活的音频编辑和声源提取。

排序理由这是一篇详细介绍新音频处理框架的研究论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Adhiraj Banerjee, Vipul Arora · 2026-04-28 04:00

CodecSep：基于提示的神经音频编解码器潜在表示的通用声音分离

arXiv:2509.11717v5 Announce Type: replace-cross Abstract: Text-guided sound separation enables flexible audio editing, assistive listening, and open-domain source extraction, but systems such as AudioSep remain too expensive for low-latency edge or codec-mediated deployment. Exis…

报道来源 [1]

CodecSep：基于提示的神经音频编解码器潜在表示的通用声音分离

相关实体

相关话题