一项新的综合测试套件“Hearing to Translate”已被开发出来,用于评估将语音模态直接集成到大型语言模型(LLMs)中进行语音到文本翻译的有效性。该研究将六个最先进的SpeechLLMs与十六个级联系统进行了基准测试,分析了在16个基准、13种语言对和9种挑战性条件下的性能。研究结果表明,虽然级联系统总体上仍然最可靠,但最近的SpeechLLMs在特定场景下可以与之匹敌甚至超越它们,而独立的Speech Foundation Models(SFMs)则普遍落后。 AI
影响 SpeechLLMs的新基准测试可能会加速对更高效、更准确的语音翻译系统的研究。
排序理由 这是一篇介绍用于评估SpeechLLMs的新基准套件的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →