PulseAugur
实时 16:56:14
中文(ZH) GPT-5级推理能力塞进语音模型,OpenAI把同传翻译成本砍穿地板价

OpenAI 发布 GPT-5 级别语音模型,支持实时翻译和智能代理

OpenAI 发布了三款新的实时语音模型:GPT-Realtime-2GPT-Realtime-TranslateGPT-Realtime-Whisper。GPT-Realtime-2 将 GPT-5 级别的推理能力集成到语音交互中,支持 128K 上下文窗口和并行工具调用。GPT-Realtime-Translate 提供跨多种语言的实时、低成本同声传译,大幅降低了传统人工译员的成本。GPT-Realtime-Whisper 提供低延迟的流式语音到文本转录。 AI

影响 这些模型显著降低了实时语音翻译和 AI 驱动的语音代理的成本并提高了可及性,有可能颠覆同声传译行业,并实现更自然的人机交互。

排序理由 OpenAI 发布了三款具有先进功能的新语音模型,包括 GPT-5 级别的推理能力和实时翻译。[lever_c_demoted from frontier_release: ic=1 ai=1.0]

在 量子位 (QbitAI) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

OpenAI 发布 GPT-5 级别语音模型,支持实时翻译和智能代理

报道来源 [1]

  1. 量子位 (QbitAI) TIER_1 中文(ZH) · 听雨 ·

    GPT-5 level reasoning ability packed into a voice model, OpenAI slashes simultaneous interpretation costs to the floor.

    OpenAI上新三款实时语音模型