English(EN) Acoustic Prompting via Stage-wise Modulation for Few-Shot Learning in Audio Language Models

新框架通过可训练的音频提示增强音频语言模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-16 04:00

研究人员为音频语言模型（ALMs）开发了一个新框架，该框架将可训练的提示直接引入音频编码器。这种方法旨在捕获任务特定的声学特征，通过补充现有的文本端提示学习方法来增强少样本适应性。在11个数据集上的实验表明，当与文本提示调优集成时，这种即插即用模块通常可以提高性能，这表明对音频表示空间进行显式调制是有效的。 AI

排序理由该集群包含一篇详细介绍音频语言模型新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Hyebin Cho, Jaehyuk Jang, Changick Kim, Joon Son Chung · 2026-06-16 04:00

Acoustic Prompting via Stage-wise Modulation for Few-Shot Learning in Audio Language Models

arXiv:2606.15751v1 Announce Type: cross Abstract: Audio-Language Models (ALMs) have shown remarkable success in zero-shot audio classification by aligning audio waveforms with text. Recent efforts to improve downstream performance focus on learning optimal text prompts. However, …

报道来源 [1]

Acoustic Prompting via Stage-wise Modulation for Few-Shot Learning in Audio Language Models

相关实体

相关话题