中国人工智能实验室 StepFun 发布了 StepAudio 2.5 Realtime,这是一款新的端到端实时语音模型。该系统处理音频输入和输出,并包含用于个性控制和副语言理解的功能。 AI
影响 这款新的语音 AI 模型可以通过先进的个性和副语言控制来增强实时音频应用。
排序理由 该集群描述了一个新 AI 模型的发布。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →