研究人员开发了一种新颖的扩散模型,用于零样本环境声音分类,这项任务在历史上一直面临性能不佳的困境。该新模型为未见过的类别生成合成嵌入,然后将这些合成嵌入与现有嵌入结合起来训练分类器。在六个音频数据集上的实验表明,该扩散模型显著优于先前的基线方法,使其成为该音频分析领域的挑战性问题的一种有前途的方法。 AI
影响 为零样本音频分类中的生成方法树立了新的基准,有望提高AI理解各种声景的能力。
排序理由 这是一篇详细介绍特定AI任务新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- ARCA23K-FSD
- CADA-VAE
- Diffusion model
- ESC-50
- FSC22
- GTZAN
- TAU Urban Acoustics 2019
- UrbanSound8k
- Zero-shot learning
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →