新AI模型FIGMA增强细粒度音乐检索

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-08 04:00

研究人员开发了FIGMA，一种旨在利用自然语言描述改进细粒度音乐检索的新架构。与以往在节奏或调性等详细音乐属性方面表现不佳的模型不同，FIGMA采用多视图对比方法，能够更好地捕捉高级语义和帧级音乐细节。FGMCaps数据集的创建为此项进展提供了支持，该数据集包含380,000个音乐-描述对，使FIGMA在音乐检索任务上的表现显著优于现有模型。 AI

影响增强了AI根据详细音乐属性理解和检索音乐的能力，可能影响音乐发现和策展工具。

排序理由该集群包含一篇详细介绍特定AI任务的新模型架构和数据集的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Nishit Anand, Ashish Seth, Sreyan Ghosh, Dinesh Manocha, Ramani Duraiswami · 2026-06-08 04:00

FIGMA: 迈向细粒度音乐检索

arXiv:2606.06615v1 Announce Type: cross Abstract: Retrieving music using natural language descriptions has improved with contrastive audio-text models such as CLAP, but current systems remain limited to coarse semantic queries. When descriptions specify fine-grained musical attri…

报道来源 [1]

FIGMA: 迈向细粒度音乐检索

相关实体

相关话题