OpenAI 发布了三款新的实时语音模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。GPT-Realtime-2 将 GPT-5 级别的推理能力集成到语音交互中,支持 128K 上下文窗口和并行工具调用。GPT-Realtime-Translate 提供跨多种语言的实时、低成本同声传译,大幅降低了传统人工译员的成本。GPT-Realtime-Whisper 提供低延迟的流式语音到文本转录。 AI
影响 这些模型显著降低了实时语音翻译和 AI 驱动的语音代理的成本并提高了可及性,有可能颠覆同声传译行业,并实现更自然的人机交互。
排序理由 OpenAI 发布了三款具有先进功能的新语音模型,包括 GPT-5 级别的推理能力和实时翻译。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- Alex Kim
- Ben Badejo
- BolnaAI
- ChatPRD
- GPT-5
- GPT-Realtime-2
- GPT-Realtime-Translate
- GPT-Realtime-Whisper
- Jason Liu
- Josh Weisberg
- OpenAI
- OpenClaw
- Romain Huet
- Sablecrest Robotics
- Zillow
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →