研究人员已经证明,预先训练好的声学嵌入模型可以在无需微调的情况下有效分类大象的发声。鉴于标注过的生物声学数据的稀缺性和高成本,这种方法尤其有价值,因为传统监督方法常常会导致过拟合。该研究评估了各种嵌入模型,其中Perch 2.0表现最佳,对非洲象和亚洲象的叫声都显示出很高的分类准确率。值得注意的是,来自transformer编码器(如wav2vec2.0和HuBERT)的中间表示被证明信息量很大,这表明了在设备上进行高效处理的潜力。 AI
影响 展示了一种使用预训练模型进行有效生物声学分类的方法,可能减少专业AI应用的特定数据需求。
排序理由 学术论文,展示了现有模型在新领域的创新应用。
- African bush elephant
- arXiv
- Asian elephant
- Christiaan Geldenhuys
- HuBERT
- Perch 1.0
- Perch 2.0
- wav2vec2.0
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →