FBK 研究人员为 IWSLT 2026 指令遵循共享任务开发了 SpeechLLMs,重点关注短篇幅和长篇幅语音指令遵循。对于短篇幅任务,他们的模型取得了 2.0708 的 SIFS 分数。在长篇幅任务中,他们探索了各种分段方法,并引入了 HIFS 分数来评估性能,发现固定的 30 秒分段产生了最佳结果,得分为 2.0663。分析表明,长篇幅生成中的幻觉主要涉及重复插入,尽管短篇幅能力基本保持不变。 AI
影响 这项研究有助于推进语音指令遵循模型,可能改进 AI 系统通过语音理解和执行命令的方式。
排序理由 该集群包含一篇学术论文,详细介绍了提交给共享任务的新模型。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →