AssemblyAI 推出了新的流式语音说话人分离技术,旨在实时识别直播音频捕获过程中的说话人。该系统在对话进行的同时,能在几毫秒内分配 SPEAKER_A 和 SPEAKER_B 等说话人标签,从而根据说话人立即采取行动。虽然与批量处理相比,此实时功能在准确性上有所折衷,但它解锁了需要即时说话人归属的新应用,例如实时语音代理和联络中心辅导。 AI
影响 通过提供即时的说话人归属,实现了新的实时语音应用。
排序理由 关于特定 AI 功能的产品公告。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →