PulseAugur
实时 16:19:07
实体 SALMONN

SALMONN

PulseAugur coverage of SALMONN — every cluster mentioning SALMONN across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96206 ·

    新指标ALAS评估音频语言模型对齐情况

    研究人员开发了ALAS(自动潜在对齐分数),用于评估音频语言模型将音频帧与文本标记对齐的程度。该模型和任务无关的指标分析了大型语言模型的隐藏状态,将音频和文本表示与源自Whisper的参考进行比较。ALAS仅需要一个固定的前向传播和一个现成的ASR参考,无需训练或拟合分类器。当应用于四个开源Speech-LLM时,ALAS显示对齐深度反映了音频编码器设计和任务需求,并且可以识别出在没有真正音频基础的情况下表现良好的模型。