研究人员推出了 Audio-FLAN,一个旨在统一大型语言模型音频理解与生成任务的新型大规模数据集。该数据集包含超过 1 亿个实例,涵盖 80 个多样化任务,涉及语音、音乐和通用声音领域。Audio-FLAN 旨在实现统一音频语言模型的零样本学习,使其能够处理音频内容的理解与创作。 AI
影响 赋能多样化理解与生成任务的统一音频语言模型。
排序理由 该集群包含一篇详细介绍人工智能研究新数据集的学术论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →