研究人员推出SelectTSL,这是一种新颖的端到端架构,专为复杂声学环境中的提示引导选择性声音定位而设计。该系统通过提取目标声音并保留空间信息以实现准确的定位,克服了现有方法的局限性。SelectTSL利用提示引导选择性注意力模块生成提示信息嵌入,然后该嵌入会优化相位线索并估计到达方向和声源基数,从而有效地关注用户指定的空间线索并处理不同数量的目标声源。 AI
影响 引入了一种新的选择性声音定位方法,有望提高AI在嘈杂环境中关注特定音频源的能力。
排序理由 详细介绍新AI模型和方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →