Step Audio 2.5 实时发布:主观评分 80.41 分,较 GPT-Realtime-1.5 大幅领先 18%,语音通话费用 3.8 元/小时

据 Beating,Step Audio 2.5 Realtime(Step Cosmos 的端到端实时语音模型)于 2026 年 4 月在其开放平台 API 上线。该模型强调自然对话,支持可定制的角色人设,并具备副语言感知(语调、停顿、叹息)。

在官方五个维度的测试中,Step Audio 2.5 Realtime 在所有类别中均排名第一。主观评估得分(真实用户手机应用对话)达到 80.41,而 GPT-Realtime-1.5 为 68.01,Gemini Live 为 67.16。语音问答基准得分为 79.80,几乎是 GPT-Realtime-1.5 的 1.5 倍(53.20)。API 定价:每百万输入 token 收取 10 元(缓存命中为 2 元),每百万输出 token 收取 70 元;持续语音通话预计为每小时 3.8 元。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论