生成配置
在此处了解您可以调整哪些参数来影响生成结果
在完成内容编辑后,您可以在功能区点击齿轮图标进行生成配置的调整。
(移动端同样为齿轮图标)
生成参数对于最终生成的效果会有很大影响,目前我们基于多方测试和调整,设置了不同的预设模板,分别对应不同的优化方向,您可以通过调整预设来选择不同的生成参数,以找到对于您来说最合适的效果。
可手动调整的生成设置
情感风格:针对生成时输入的内容,不同的风格偏向将在处理时优化理解和还原不同的细节部分,选择偏向文本时,将根据输入文本的语义完善结果细节,更符合文本语境;选择偏向角色时,将更注重还原声音角色样本的直接表现力。
生成种子:控制生成时的随机性,相同的种子会在生成时产生相似的结果,这个值可由 1至 2147483647 的整数。默认设置为-1 时完全随机。通常不需要调整。
语速:控制生成语音的速度,值越大,语速越快,可调整为0.5x到2x之间的数值,1为正常语速
V3.0 系列模型新增的独特配置
在 V3.0 系列模型中,我们新增了细微调节的独特参数,这些参数能让您独立控制单个段落的细节,分配有 V3 模型角色的段落将可额外控制以下设置:
语言选择:指定段落中内容的语言。默认系统自动识别输入内容的语言,如出现识别不够精准的情况或您输入的语言为粤语时,请手动选择语言。(目前暂时无法自动识别粤语)
该功能并非翻译,而是用于区分文本在不同语种下书面和发音的差异,如中文汉字与日语汉字读法有明显的不同,需要中文和日语混合的内容,在手动指定语种后,能够避免自动匹配上下文时将中文汉字读作日语。指定为粤语和文本为粤语时,则支持输入中文标准语句与粤语语句。
语音质量分数:可调节语音的质量强化比例,越高的分数质量越好,但对于部分角色可能会降低音色相似度。
情感比例:这一功能参数能够让您调节段落发音的情感倾向,启用该功能后,您可手动指定情感比例,包括生气、开心、中立、难过、匹配上下文几种,模型将根据设置的比例尝试以对应情感表现进行发音。
一致性优化:实验功能,启用后将优化汇集在单个段落中的长篇内容生成效果,提升一致性与连贯性。对于文本内容的编辑,可参见文本内容编辑进行了解。
在参数设置完毕后关闭配置弹窗,只需点击功能区的开始生成按钮即可提交语音生成任务,任务提交完毕后,系统将会开始生成任务,您可在主要界面观看生成进度,并在完成后开始播放。