研究人员推出了BEST-RQ-2,这是自监督音频表示学习的一项进展。这种新方法采用两步预训练方法,将上下文化和预测阶段分开。通过为未遮蔽区域使用ViT上下文编码器,为遮蔽区域使用轻量级预测器,BEST-RQ-2在X-ARES和XARES-LLM等基准测试上表现优于单阶段方法,同时保持可比的推理计算。该模型的代码和检查点均公开可用。 AI
影响 引入了一种新颖的自监督音频学习方法,有望提高各种音频任务和基准测试的性能。
排序理由 该集群包含一篇详细介绍自监督音频表示新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →