PulseAugur
实时 14:45:31
English(EN) CodecSep: Prompt-Driven Universal Sound Separation on Neural Audio Codec Latents

CodecSep 在神经音频编解码器潜在空间中实现基于提示的声源分离

研究人员开发了 CodecSep,一个在神经音频编解码器潜在空间中直接操作的、用于基于提示的声源分离的新框架。与现有方法相比,这种方法能够以显著降低的计算成本实现开放词汇的声源分离。CodecSep 集成了冻结的 DAC 主干和一个轻量级的 Transformer masker,能够在边缘设备和编解码器传输管道中实现高效、低延迟的部署。 AI

影响 在边缘设备和实时传输中实现更高效、更灵活的音频编辑和声源提取。

排序理由 这是一篇详细介绍新音频处理框架的研究论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

CodecSep 在神经音频编解码器潜在空间中实现基于提示的声源分离

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Adhiraj Banerjee, Vipul Arora ·

    CodecSep: Prompt-Driven Universal Sound Separation on Neural Audio Codec Latents

    arXiv:2509.11717v5 Announce Type: replace-cross Abstract: Text-guided sound separation enables flexible audio editing, assistive listening, and open-domain source extraction, but systems such as AudioSep remain too expensive for low-latency edge or codec-mediated deployment. Exis…