AssemblyAI 发布了实时语音转文本 (STT) 延迟的基准测试,强调最低延迟并不总是等同于语音代理的最佳性能。该公司认为,“足够快且准确”优于“最快但错误”,因为语音代理需要速度和准确性之间的平衡,以避免误解关键信息。AssemblyAI 强调了首次令牌时间 (TTFT) 和完成回合时间 (TTCT) 等关键指标,并强调了生产环境中 P95 延迟相对于中位数 (P50) 延迟的重要性。据报道,其 Universal-3.5 Pro Realtime 模型在真实语音代理音频基准测试中实现了具有竞争力的 6.99% 的词错误率。 AI
影响 强调了语音代理速度和准确性之间的关键平衡,影响 STT 模型选择。
排序理由 来自非前沿实验室的产品基准测试发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →