Resemble AI 今天在 Hugging Face 发布 DramaBox,面向导演级别的可控语音模型

PROMPT-0.45%
IN-0.81%

据 Beating 称,Resemble AI 于今日在 Hugging Face 发布 DramaBox,这是一款语音生成模型。该模型通过分离的提示语法实现导演级别的可控性——用户在引号中输入对话,同时在引号外指定舞台指令,如叹气、停顿或耳语。该模型会将这些指令渲染为带有情感起伏的语音,而非逐字朗读这些指令。

DramaBox 支持零样本语音克隆,只需 10 秒参考音频,并允许使用自然语言提示来设置角色年龄、口音和情绪。输出为 48kHz 立体声录音室品质音频。所有生成的音频都包含一个不可见的 Perth 水印,能够抵抗 MP3 压缩,并配套标准音频编辑以防止深度伪造的滥用。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论