Google AI 发布了 Gemini 3.1 TTS 和 Gemini 3.1 Flash TTS,这是他们最新的文本转语音模型。这些模型提供了增强的表达能力和控制力,引入了音频标签,通过自然语言命令来指导声音风格、语速和表达方式。音频标签旨在成为用户塑造文本转语音模型输出的直观方式。 AI
排序理由 主要 AI 实验室发布了新模型版本,但不是前沿模型发布。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →
Google AI 发布了 Gemini 3.1 TTS 和 Gemini 3.1 Flash TTS,这是他们最新的文本转语音模型。这些模型提供了增强的表达能力和控制力,引入了音频标签,通过自然语言命令来指导声音风格、语速和表达方式。音频标签旨在成为用户塑造文本转语音模型输出的直观方式。 AI
排序理由 主要 AI 实验室发布了新模型版本,但不是前沿模型发布。
AI 生成摘要 · Google Gemini · 来自 3 个来源。 我们如何撰写摘要 →
Last week, we launched Gemini 3.1 TTS, our latest and best text-to-speech model. This new model introduces [awe] audio tags, an intuitive way to guide vocal style, pace, and delivery. Here are some tips on the best ways to use audio tags in your prompts: 1. All inline tags must…
Gemini 3.1 Flash TTS is rolling out in Google Vids and is available today in preview via the Gemini API and in @GoogleAIStudio. Whether you’re creating a pitch deck or recording a passion project, transform your scripts into studio-quality narration: https://t.co/MG2YIQwKb6
Today we launched Gemini 3.1 Flash TTS, our most expressive and controllable text-to-speech model yet. This launch [excitement] includes audio tags! 🗣🏷 Audio tags [explanatory] are a seamless way to guide vocal style, pace, and delivery using natural language commands embedded h…