Loka 使用 AWS 的语音到语音模型 Amazon Nova 2 Sonic 开发了一个对话式 AI 语音助手。这种新方法对音频进行端到端处理,捕捉了传统基于文本的流程中丢失的细微差别,并显著降低了延迟。该系统在大语言模型音频基准测试(Big Bench Audio)上取得了高分,优于 Gemini 2.5 Flash Native Audio 和 GPT Realtime 等竞争对手,同时还提供了大规模部署的成本效益。 AI
影响 展示了语音到语音模型在实现更自然、更高效的语音助手交互方面的进步。
排序理由 本文描述了一家公司使用 AI 模型构建产品,而不是发布新模型或前沿实验室的重大研究发现。
在 AWS Machine Learning Blog 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →