阶跃星辰语音模型位列Artificial Analysis中国第一:StepAudio 2.5 TTS跻身全球前三
5月10号据财联社报道,全球权威TTS评测榜单Artificial Analysis Speech Arena更新,阶跃星辰旗下语音生成模型StepAudio 2.5 TTS跻身全球前三,成为当前榜单排名最高的中国大模型。此次更新标志着国产语音大模型在真实听感盲测领域的重大突破。
榜单采用盲测Elo评分机制,用户在未知模型身份下对同一文本生成的两段语音进行听感判断,覆盖客户服务、知识分享、数字助手、娱乐等场景。阶跃星辰近期集中发布StepAudio 2.5系列,包括TTS、ASR和Realtime三款模型,覆盖语音生成、识别与实时交互全链路。
技术上,StepAudio 2.5 TTS基于端到端多模态架构,融合语音理解、推理与生成,有效降低时延并提升自然度表现。同系列的Realtime模型围绕副语言感知、人设自定义与对话能力三维升级,用户可调整AI角色特征,内置5个预设人设,官方评测用户体验评分达80.41,高于GPT-Realtime-1.5与Gemini Live。
行业影响加速落地。阶跃语音模型已在吉利银河M9实现端到端语音大模型量产上车,并为极氪8X提供交互能力。腾讯云4月与阶跃星辰达成战略合作,加速大模型上车进程。开源原生推理语音模型Step-Audio-R1.1连续多月霸榜Artificial Analysis Speech Reasoning全球第一。
分析人士指出,语音大模型正从实验室走向规模化商用关键期,自然度与实时性成为核心竞争力。建议开发者关注端到端架构优化,积极接入API平台降低落地成本;企业侧应加速车载、客服等高价值场景布局,抢占智能交互入口先机。
阶跃星辰StepAudio 2.5 Realtime登顶中国语音模型榜首
« 上一篇
2026-05-10
Hermes Agent单日Token消耗2710亿 登顶全球AI应用调用榜
下一篇 »
2026-05-10