研究人员开发了 BayLing-Duplex,这是一种新颖的全双工语音语言模型,无需依赖外部轮流模块即可实现同时听和说。这个单一的自回归 LLM 可以处理自然的对话现象,如打断和犹豫。通过一个适度的数据集进行微调,BayLing-Duplex 在轮流和打断处理方面表现出很高的成功率,同时与基于轮流的模型相比,保持或提高了响应质量。 AI
影响 这项研究通过实现真正的实时、同步语音交互,有可能加速更自然、响应更快的对话式 AI 代理的开发。
排序理由 该集群包含一篇详细介绍新模型架构和实验结果的学术论文。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →