快速开始

了解如何在VOCU中注册并生成您的第一条语音

账号注册

Vocu账号

您只需通过您的邮箱您指定的密码即可进行登录或注册,并开始使用VOCU的所有服务。当您在未登录状态下访问VOCU控制台arrow-up-right时,您将可以看到让您通过邮箱与密码进行登录的输入框;若您还没有进行过注册,只需点击页面下方的注册按钮即可开始进行注册流程。

第三方账号

除邮箱登录与注册外,VOCU还接入了常见平台账号,以及悟声通行证作为您可选的第三方登录方式。当您通过第三方平台帐户注册时,我们将在您登录后获取您帐户的邮箱或ID,并将其作为您在VOCU的唯一凭据来创建帐户。

通过悟声 Passport通行证,您将可以使用曾注册充值过的中国大陆手机号登录Vocu.aiarrow-up-right,并可通过设置转移后消费使用对应账号中的点数。

注册奖励

在您通过任意方式初次登录VOCU后,您将免费获得1500点数以供您体验我们的各类服务。您可以通过每日签到来免费领取更多点数,或者通过付费来大量购买更多点数。

创建角色

查看详细介绍

除了使用社区角色外,您还可以在角色管理arrow-up-right页面中创建一个角色,并为其上传或录制音频样本后,通过该自定义角色来进行语音生成。

您也可以在配音工作室arrow-up-right页面中选择角色时的弹窗中选择"创建新角色..."按钮来召唤出角色创建面板,并用其来创建一个角色。

circle-info

样本质量比长度更重要。有噪音的样本可能会产生不好的结果,请尽可能提供高质量的样本语音。目前,样本语音长度需大于2秒,且文件大小不超过20M。您也可以通过一些音频编辑软件人声分离/音频降噪/人声美化/响度标准化等功能来尝试从任意音频中获得较高质量的人声音频样本。

circle-exclamation

语音生成

在您拥有了第一个角色以后,您就可以在配音工作室arrow-up-right页面中开始生成您的第一条语音了。

文本内容编辑

查看详细介绍

您只需在页面中的文本输入框中分配一个角色,输入任意文本,即可开始语音生成,如果您需要优化多段文字,您可点击添加段落按钮进行增加,也可以通过自动分段添加粘贴您需要的内容并点击添加,系统将会自动对您的文本进行拆分,并逐条添加到上方的列表中。

在这之后,您还可以对列表中的每个条目进行单独编辑、分配角色、调整顺序、删除内容、向下插入等操作。

circle-exclamation
triangle-exclamation

生成参数配置

查看详细介绍

在完成内容编辑后,您就可以在页面段落的齿轮处(每个段落的下方)中进行生成配置的调整。

生成预设对于最终生成的效果会有很大影响,我们预先配置了较为均衡的预设作为默认设置,如果您需要调整,可通过切换不同的预设,找到对于您来说最合适的效果。

circle-info

许多情况下,您可以先尝试使用默认参数的配置进行生成,若未能达到您预期效果再考虑进行调整。

chevron-right可手动调整的高级生成设置hashtag
  • 生成预设:用于控制语音在生成时采用的表现策略,决定语音在听感上的基础表现力。不同的生成预设侧重不同的参数方向,能够决定输出语音与文本之间的理解表现力(例如,使用均衡预设,语音将平衡发音表现和文本理解的表现,贴合内容的理解,而使用创意类预设,语音将基于文本的语境,展现出更具有表演色彩的发音方式,在应对不同场景时会有较为独特的效果。)

  • 情感风格:针对生成时输入的内容,不同的风格偏向将在处理时优化理解和还原不同的细节部分,选择偏向文本时,将根据输入文本的语义完善结果细节,更符合文本语境;选择偏向角色时,将更注重还原声音角色样本的直接表现力。

  • 生成种子:控制生成时的随机性,相同的种子会在生成时产生相似的结果,这个值可由 1至 2147483647 的整数。默认设置为-1 时完全随机。通常不需要调整。

  • 语速:控制生成语音的速度,值越大,语速越快,可调整为0.5x到2x之间的数值,1为正常语速

chevron-rightV3.0 系列模型新增的独特配置hashtag

在 V3.0 系列模型中,我们新增了一些独特参数,分配有 V3.0 模型角色的段落将可额外控制以下设置:

  • 语言选择:指定段落中内容的语言。默认情况下系统可自动识别输入内容的语言,如出现识别不够精准的情况或您输入的语言为粤语时,请手动选择语言。(目前暂时无法自动识别粤语内容)

  • 生动表达:支持为单个段落单独启用“生动表达”选项。启用后,模型将基于对内容的理解拓展表现范围,使语句更具表现力和感染力(对日语ASMR效果最佳),但可能降低生成稳定性。

  • 情感比例:这一功能参数能够让您调节段落发音的情感倾向,启用该功能后,您可手动指定情感比例,包括生气、开心、中立、难过、匹配上下文几种,模型将根据设置的比例尝试以对应情感表现进行发音,具体效果因不同样本可能区别较大,且可能降低生成稳定性。

  • 一致性优化实验功能,启用后将优化汇集在单个段落中的长篇内容生成效果,提升一致性与连贯性,但可能降低表现力。对于文本内容的编辑,可参见文本内容编辑arrow-up-right进行了解。

  • 后处理模式:实验功能,该项目控制输出优化策略,默认将针对角色声音的还原度进行优化。此外,不同的选项可调节最终音频的听感表现,您可根据需要来尝试调整此项设置。

在最新的配置模板下,您只需在输入内容并分配角色后,点击下方的开始生成按钮即可提交语音生成任务,并能够实时观察到生成的进展,以及快速试听段落和整体的效果。

任务队列

查看详细介绍

您可以在此处查看并管理您正在进行中的生成任务,以及所有历史任务的状态。任务的状态将实时更新,您无需手动刷新。在您开始了一个新的生成任务后,您可在编辑器中看到每个段落的任务状态,在打开任务队列后(时钟图标),您的最新任务将出现在列表最上方。

您可以点击查看列表中每个任务的详情,播放每个任务的最终生成结果(如果有),或在每个任务的下拉菜单中快速进行音频下载、复制到编辑器、删除任务历史等操作。

每个段落的任务记录是可独立查看,方便您进行单个段落的调整。

circle-info

您可以在项目的编辑器中看到看每个段落的生成状态,并单独播放或下载某个段落的音频。我们还支持对单个段落进行重新生成,且不会影响其它段落的状态。

最后更新于

这有帮助吗?