OpenAI 推出了其实时 API 的公开测试版,允许开发者将低延迟、语音到语音的对话体验集成到他们的应用程序中。这个由 GPT-4o 模型驱动的新 API 通过直接流式传输音频输入和输出,支持中断处理和函数调用等功能,从而实现自然的交互。此外,OpenAI 还为其 Chat Completions API 引入了音频输入和输出功能,为开发者提供了一种更简单的方式来构建支持语音的应用,而无需拼接多个模型。 AI
排序理由 OpenAI 发布了新的 API,供开发者将其现有模型集成到他们的产品中。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →