xAI 新推出的 Grok TTS 模型在人类指数(Humanness Index)上取得了高分,该指数用于评估合成语音的逼真程度。在盲测投票中,Grok TTS 在各种语音模型中排名第一,得分 96 分(满分 100 分),仅比真实人声低 4 分。 AI
影响 为逼真语音合成树立了新标杆,可能影响未来的语音 AI 发展。
排序理由 Frontier-lab 模型发布,附带系统卡。[lever_c_demoted from frontier_release: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →