VOCU AI 帮助文档
返回创作中心
  • 📖使用指南(当前)
  • ⚙️API文档
  • 入门
    • 概览
    • 快速开始
    • 模型介绍
  • 语音克隆&角色管理
    • 概览
    • 瞬时克隆
    • 专业克隆
    • 管理角色
    • 注意事项
  • 语音合成
    • 概览
    • 文本内容编辑
    • 生成配置
    • 任务队列
    • 任务详情
  • 故障排除
    • 概览
  • 政策与规范
    • 服务协议
    • 账号协议
    • 账号注销协议
    • 隐私保护声明
    • 违规信息类型说明
由 GitBook 提供支持
在本页

这有帮助吗?

导出为 PDF
  1. 语音克隆&角色管理

瞬时克隆

在这里了解如何添加一个角色并为其指定一个语音样本来进行瞬时克隆

上一页概览下一页专业克隆

最后更新于2个月前

这有帮助吗?

通过瞬时语音克隆,您只需提供5-30秒任意样本,且无需对模型进行任何训练,瞬间即可完成克隆;我们的AI会在生成时即时根据百万小时的经验,尽可能模仿被克隆音频样本的语调、语速、情感、停顿、响度、声学环境、呼吸声、口音、发声方式等特征,且尽可能理解目标文本的上下文,并综合它们来产生最具表现力且最匹配的语音。

目前,您可以通过页面的"添加角色"按钮,或者在页面中使用左下角的"快速创建新角色..."按钮来召唤出角色创建面板,并用其来创建一个角色。

您需要为创建的角色指定一个名称,并可选地指定一段描述以及一个头像。目前,名称、描述和头像仅供展示,并不会影响语音克隆的行为。

随后,您需要上传一个音频文件,或录制一段音频,作为本次克隆的默认风格指引样本;这段默认风格样本将用于定义该角色默认的声音表现,包括声线、情感、语速、语调、韵律等(稍后您可以在角色详情页中添加更多不同的风格样本)。

音频上传完毕后,点击右下角的添加按钮并等待处理完毕即可。

样本质量比长度更重要。有噪音的样本可能会产生不好的结果,请尽可能提供高质量的样本语音。目前,样本语音长度需大于2秒,且文件大小不超过10M。您可以使用剪映电脑版的人声分离/音频降噪/人声美化/响度标准化等功能来简单便捷的从任意音频中获得较高质量的人声音频样本;我们也即将在我们的服务中直接提供此类能力。

目前,我们仅支持中英文样本语音,请确保您提供的样本语音中包含可被正确识别的中英文内容,且不包含其他语言内容,否则将会导致角色创建失败,或导致其它各类问题。

请勿使用我们的服务克隆或生成任何侵犯版权、违反道德伦理、或违反中华人民共和国与您所在地法律法规的内容。我们生成的所有内容均带有详细日志,自动/人工复审,以及可溯源的隐形音频水印,若发现您违反了相关规则,我们保留终止您的服务并上报政府机关等机构的权利。

关于瞬时克隆样本音频的详细注意事项和最佳实践,请。

更多信息请参阅、、。

参阅此页面
服务协议
账号协议
隐私声明
角色管理
语音生成