PulseAugur
实时 16:57:10
English(EN) AudioDER: A Deduplication-Enhanced Reasoning Dataset for Post-Training Large Audio-Language Models

新的AudioDER数据集提升LALM推理能力

研究人员推出了AudioDER,一个旨在增强大型音频语言模型(LALMs)推理能力的新数据集。该数据集通过去重过程提高多样性,解决了现有音频语言数据集中冗余的问题。AudioDER包含约191,000个样本,每个样本包括一个音频片段、一个多项选择题、答案选项、一个音频字幕以及由Qwen3-30B生成的思维链推理过程。实验表明,在AudioDER上对Qwen2-Audio-7B-Instruct等LALMs进行预训练后,在各种音频推理基准测试上的性能得到了一致提升。 AI

影响 该数据集有望加速LALMs在音频推理方面的进展,从而带来更复杂的音频理解应用。

排序理由 该集群描述了一个新的学术数据集和研究论文,专注于改进AI模型。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的AudioDER数据集提升LALM推理能力

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Hui Geng, Yi Su, Han Yin, Tianjiao Wan, Qisheng Xu, Jiaxin Chen, Zijian Gao, Hengzhu Liu, Xie Chen, Kele Xu ·

    AudioDER:用于预训练大型音频语言模型的增强去重推理数据集

    arXiv:2606.14591v1 Announce Type: cross Abstract: Large Audio-Language Models (LALMs) have shown strong performance on a wide range of audio understanding tasks, yet they still struggle with complex audio reasoning. A practical way to improve such capabilities is post-training, w…

  2. arXiv cs.AI TIER_1 English(EN) · Kele Xu ·

    AudioDER:用于后训练大型音频语言模型的增强去重推理数据集

    Large Audio-Language Models (LALMs) have shown strong performance on a wide range of audio understanding tasks, yet they still struggle with complex audio reasoning. A practical way to improve such capabilities is post-training, whose effectiveness critically depends on the quali…