研究人员开发了MusicJudge,一个旨在通过考虑歌词准确性和音乐保真度来自动评估歌唱表现的新框架。与以往只关注声学线索或歌词转录的系统不同,MusicJudge通过块对齐的多模态分析整合了这些模态。该框架使用多信号匹配,结合了语义嵌入、词汇相似性和语音对齐来识别歌词块,并采用Modality-Guided LoRA对自动语音识别(ASR)进行微调,以改进歌唱音频转录。实验表明,MusicJudge与人类专家的判断高度一致,并展示了跨不同数据集的泛化能力。 AI
影响 该框架有望推动自动化音乐教育和表演分析工具的发展。
排序理由 学术论文,详细介绍了一个新的歌唱表现评估框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →