中文(ZH) GPT-5级推理能力塞进语音模型，OpenAI把同传翻译成本砍穿地板价

OpenAI 发布 GPT-5 级别语音模型，支持实时翻译和智能代理

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:35

OpenAI 发布了三款新的实时语音模型：GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。GPT-Realtime-2 将 GPT-5 级别的推理能力集成到语音交互中，支持 128K 上下文窗口和并行工具调用。GPT-Realtime-Translate 提供跨多种语言的实时、低成本同声传译，大幅降低了传统人工译员的成本。GPT-Realtime-Whisper 提供低延迟的流式语音到文本转录。 AI

影响这些模型显著降低了实时语音翻译和 AI 驱动的语音代理的成本并提高了可及性，有可能颠覆同声传译行业，并实现更自然的人机交互。

排序理由 OpenAI 发布了三款具有先进功能的新语音模型，包括 GPT-5 级别的推理能力和实时翻译。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

量子位 (QbitAI) TIER_1 中文(ZH) · 听雨 · 2026-05-08 04:35

GPT-5 level reasoning ability packed into a voice model, OpenAI slashes simultaneous interpretation costs to the floor.

OpenAI上新三款实时语音模型

报道来源 [1]

GPT-5 level reasoning ability packed into a voice model, OpenAI slashes simultaneous interpretation costs to the floor.

相关实体

相关话题