实体 Speech LLMs

Speech LLMs

PulseAugur coverage of Speech LLMs — every cluster mentioning Speech LLMs across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

2

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_109571 · Jun 24 · 06:15

语音翻译预训练提升语音大语言模型性能

研究人员探索了一种新颖的方法，通过纳入语音翻译目标来预训练语音大语言模型的语音编码器。该方法旨在弥合特定语言编码器表示与大语言模型语言无关空间之间的差距。通过要求模型处理跨语言任务，它学习到更鲁棒、语言无关的表示，从而改善与大语言模型的集成并提高各种下游语音大语言模型任务的性能。
RESEARCH · CL_62762 · May 29 · 06:33

新框架SURE使语音AI模型评估标准化

研究人员推出SURE，一个旨在标准化和提高语音理解模型评估可复现性的统一框架。该框架通过标准化预测格式、归一化和评分方法，解决了比较不同语音基础模型和语音大语言模型（Speech LLMs）的挑战。SURE还包括一个将研究论文和代码转换为可运行训练管道的系统，旨在提高面向部署的语音AI结果的可比性和可复现性。