OpenAI发布了GPT-Realtime-2,这是一个超越简单听写的语音功能更新。这一新版本使语音能够作为实时界面,用于聆听、推理、翻译、工具调用和响应生成。这些进步尤其有利于产品开发、客户支持和可访问性,但也引发了对语音激活代理进行管理的考量。 AI
影响 实现更自然、实时的语音交互,可能改变用户界面和代理能力。
排序理由 前沿实验室发布新模型,功能增强。[lever_c_降级自 frontier_release: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →