实体 StepAudio 2.5

StepAudio 2.5

PulseAugur coverage of StepAudio 2.5 — every cluster mentioning StepAudio 2.5 across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 4

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

时间线

2026-05-11 research_milestone StepAudio 2.5 text-to-speech model achieved a top 3 global ranking, surpassing ElevenLabs v3. 来源

最近 · 第 1/1 页 · 共 4 条

TOOL · CL_61172 · May 30 · 14:33

StepAudio 2.5在情感测试中击败OpenAI和Google

中国初创公司StepFun的新模型StepAudio 2.5据报道在情感解读测试中超越了OpenAI和Google的系统。该模型使用了10,000个基础模式进行训练。
TOOL · CL_47618 · May 22 · 00:00

StepAudio 2.5 通过 RLHF 统一 ASR、TTS 和实时交互

一份新的技术报告介绍 StepAudio 2.5，这是一款统一的音频语言模型，旨在在自动语音识别 (ASR)、文本到语音合成 (TTS) 和实时语音交互方面表现出色。该模型通过针对任务的、来自人类反馈的强化学习 (RLHF) 来优化共享表示，从而实现这一点。这种方法允许一个单一的骨干模型被塑造成每个任务的独特操作模式，在标准基准测试中展示了最先进的性能。
TOOL · CL_26009 · May 11 · 05:05

StepAudio 2.5 TTS 模型排名超越 ElevenLabs v3

来自中国人工智能实验室的文本转语音模型 StepAudio 2.5 据报道在性能上超越了 ElevenLabs 的 v3，在全球排名中位列前三。文章称，这家成立 24 个月的新兴公司凭借在某项未指明的基准测试中优于 ElevenLabs 取得了这一成就。
RESEARCH · CL_24034 · May 9 · 07:18

Jieyue AI的StepAudio 2.5语音模型在中国排名第一，全球排名第三

Jieyue AI发布了其StepAudio 2.5系列语音模型，在TTS性能方面取得了全球领先的排名。StepAudio 2.5 TTS模型在人工分析语音竞技场排行榜上具体排名全球第三，中国第一，该排行榜使用用户盲测进行评估。该系列还包括ASR和Realtime模型，涵盖了语音生成、识别和交互的全方位，其中Realtime模型强调类人对话能力。

StepAudio 2.5在情感测试中击败OpenAI和Google

StepAudio 2.5 通过 RLHF 统一 ASR、TTS 和实时交互

StepAudio 2.5 TTS 模型排名超越 ElevenLabs v3

Jieyue AI的StepAudio 2.5语音模型在中国排名第一，全球排名第三