Google DeepMind 推出了 Gemini 3.5 Live Translate,这是一款专为实时跨语言交流设计的先进音频模型。该新模型可将语音翻译成 70 多种语言,在流式传输音频的同时进行处理,并保留原始的音调、语速和音高。用户可以通过 Google Translate 应用体验 Gemini 3.5 Live Translate,或通过 Google AI Studio 中的 API 将其集成到自己的应用程序中。 AI
影响 通过在实时翻译中保留音调和语速,实现更自然的跨语言对话。
排序理由 前沿实验室发布新模型。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →