English(EN) AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models

新的AudioDER数据集提升LALM推理能力

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-12 16:09

研究人员推出了AudioDER，一个旨在增强大型音频语言模型（LALMs）推理能力的新数据集。该数据集通过去重过程提高多样性，解决了现有音频语言数据集中冗余的问题。AudioDER包含约191,000个样本，每个样本包括一个音频片段、一个多项选择题、答案选项、一个音频字幕以及由Qwen3-30B生成的思维链推理过程。实验表明，在AudioDER上对Qwen2-Audio-7B-Instruct等LALMs进行预训练后，在各种音频推理基准测试上的性能得到了一致提升。 AI

影响该数据集有望加速LALMs在音频推理方面的进展，从而带来更复杂的音频理解应用。

排序理由该集群描述了一个新的学术数据集和研究论文，专注于改进AI模型。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Hui Geng, Yi Su, Han Yin, Tianjiao Wan, Qisheng Xu, Jiaxin Chen, Zijian Gao, Hengzhu Liu, Xie Chen, Kele Xu · 2026-06-15 04:00

AudioDER：用于预训练大型音频语言模型的增强去重推理数据集

arXiv:2606.14591v1 Announce Type: cross Abstract: Large Audio-Language Models (LALMs) have shown strong performance on a wide range of audio understanding tasks, yet they still struggle with complex audio reasoning. A practical way to improve such capabilities is post-training, w…
arXiv cs.AI TIER_1 English(EN) · Kele Xu · 2026-06-12 16:09

AudioDER：用于后训练大型音频语言模型的增强去重推理数据集

Large Audio-Language Models (LALMs) have shown strong performance on a wide range of audio understanding tasks, yet they still struggle with complex audio reasoning. A practical way to improve such capabilities is post-training, whose effectiveness critically depends on the quali…

报道来源 [2]

AudioDER：用于预训练大型音频语言模型的增强去重推理数据集

AudioDER：用于后训练大型音频语言模型的增强去重推理数据集

相关实体

相关话题