PulseAugur
实时 22:30:06
Deutsch(DE) OpenAI Voice Mode Can See Now - After Gemini Does

OpenAI 为语音模式添加视觉能力,效仿 Gemini 的功能

OpenAI 已更新其 ChatGPT 语音模式,加入了视觉输入能力,允许用户向 AI 展示物体并获取相关信息。此功能此前由 Google 的 Gemini 展示过,它使 ChatGPT 能够分析图像并提供上下文相关的回复。此次更新旨在通过整合视觉理解来增强语音助手的交互性和实用性。 AI

排序理由 产品更新为现有 AI 工具添加新功能。

在 Smol AINews 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Smol AINews TIER_1 Deutsch(DE) ·

    OpenAI Voice Mode Can See Now - After Gemini Does

    **OpenAI** launched **Realtime Video** shortly after **Gemini**, which led to less impact due to Gemini's earlier arrival with lower cost and fewer rate limits. **Google DeepMind** released **Gemini 2.0 Flash** featuring enhanced multimodal capabilities and real-time streaming. *…