研究人员开发了DyaPlex,这是一种能够实时同步处理和生成语音及肢体动作的新型全双工模型。该模型集成了基础语音模型和新的动作通路,采用了双塔Transformer架构。DyaPlex在Seamless Interaction数据集上进行训练,实现了同步的多模态交互,并为双向人类交互设定了新基准。 AI
影响 引入了一种用于同步多模态AI交互的新架构,有望推动人机通信的发展。
排序理由 该集群包含一篇详细介绍新模型的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →