# 快速开始

### 账号注册 <a href="#account" id="account"></a>

#### Vocu账号

您只需通过**您的邮箱**与**您指定的密码**即可进行登录或注册，并开始使用VOCU的所有服务。当您在未登录状态下访问[VOCU控制台](https://app.vocu.ai)时，您将可以看到让您通过邮箱与密码进行登录的输入框；若您还没有进行过注册，只需点击**页面下方**的注册按钮即可开始进行注册流程。

#### 第三方账号

除邮箱登录与注册外，VOCU还接入了常见平台账号，以及悟声通行证作为您可选的第三方登录方式。当您通过第三方平台帐户注册时，我们将在您登录后获取您帐户的邮箱或ID，并将其作为您在VOCU的唯一凭据来创建帐户。

通过悟声 Passport通行证，您将可以使用曾注册充值过的中国大陆手机号登录[Vocu.ai](http://vocu.ai)，并可通过设置转移后消费使用对应账号中的点数。

#### 注册奖励

在您通过任意方式初次登录VOCU后，您将免费获得**1500点数**以供您体验我们的各类服务。您可以通过每日签到来免费领取更多点数，或者通过付费来大量购买更多点数。

### 创建角色 <a href="#create-character" id="create-character"></a>

[查看详细介绍](https://docs.vocu.ai/zh/voices/create)

除了使用社区角色外，您还可以在[角色管理](https://app.vocu.ai/voices)页面中创建一个角色，并为其上传或录制音频样本后，通过该自定义角色来进行语音生成。

您也可以在[配音工作室](https://app.vocu.ai/generate)页面中选择角色时的弹窗中选择"创建新角色..."按钮来召唤出角色创建面板，并用其来创建一个角色。

{% hint style="info" %}
样本质量比长度更重要。有噪音的样本可能会产生不好的结果，请尽可能提供高质量的样本语音。目前，样本语音长度需**大于2秒**，且**文件大小不超过20M**。您也可以通过一些**音频编辑软件**的**人声分离/音频降噪/人声美化/响度标准化**等功能来尝试从任意音频中获得较高质量的人声音频样本。
{% endhint %}

{% hint style="warning" %}
V2 系列版本的模&#x578B;**(V2.9) 仅支持中文与英文**，使用 V2 系列模型时请确保输入的文本中不包含任何非中英文字符，例如日文韩文等，否则可能会导致**生成失败**等问题

自 V3 系列开始，我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语，以及这些语言的共计30余种口音变体；请确保您使用的模型版本及文本内容输入符合对应的支持能力。
{% endhint %}

### 语音生成 <a href="#generate" id="generate"></a>

在您拥有了第一个角色以后，您就可以在[配音工作室](https://app.vocu.ai/generate)页面中开始生成您的第一条语音了。

#### 文本内容编辑 <a href="#text-edit" id="text-edit"></a>

[查看详细介绍](https://docs.vocu.ai/zh/generate/text-edit)

您只需在页面中的文本输入框中分配一个角色，输入任意文本，即可开始语音生成，如果您需要优化多段文字，您可点击**添加段落**按钮进行增加，也可以通过**自动分段添加**粘贴您需要的内容并点击添加，系统将会自动对您的文本进行**拆分**，并逐条添加到上方的列表中。

在这之后，您还可以对列表中的每个条目进行单独编辑、分配角色、调整顺序、删除内容、向下插入等操作。

{% hint style="warning" %}
目前每个段落最多可输入 1200 字符。由于每次修改单个段落的内容都需要重新生成对应段落，如果您在使用过程中可能需要频繁调整，我们建议您将单个段落中的内容长度控制在 50 到 100字以内，并保持为单个或几个完整连贯的句子，不包含多余换行或额外空格。这样可以便于优化音频细节和进行后续编辑。
{% endhint %}

{% hint style="danger" %}
V2 系列版本的模&#x578B;**(V2.9) 仅支持中文与英文**，使用 V2 系列模型时请确保输入的文本中不包含任何非中英文字符，例如日文韩文等，否则可能会导致**生成失败**等问题

自 V3 系列开始，我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语，以及这些语言的共计30余种口音变体；请确保您使用的模型版本及文本内容输入符合对应的支持能力。
{% endhint %}

#### 生成参数配置 <a href="#gen-config" id="gen-config"></a>

[查看详细介绍](https://docs.vocu.ai/zh/generate/config)

在完成内容编辑后，您就可以在页面段落的齿轮处（每个段落的下方）中进行生成配置的调整。

**生成预设**对于最终生成的效果会有很大影响，我们预先配置了较为均衡的预设作为默认设置，如果您需要调整，可通过切换不同的预设，找到对于您来说最合适的效果。

{% hint style="info" %}
许多情况下，您可以先尝试使用默认参数的配置进行生成，若未能达到您预期效果再考虑进行调整。
{% endhint %}

<details>

<summary>可手动调整的高级生成设置</summary>

* **生成预设：**&#x7528;于控制语音在生成时采用的表现策略，决定语音在听感上的基础表现力。不同的生成预设侧重不同的参数方向，能够决定输出语音与文本之间的理解表现力（例如，使用均衡预设，语音将平衡发音表现和文本理解的表现，贴合内容的理解，而使用创意类预设，语音将基于文本的语境，展现出更具有表演色彩的发音方式，在应对不同场景时会有较为独特的效果。）
* **情感风格：**&#x9488;对生成时输入的内容，不同的风格偏向将在处理时优化理解和还原不同的细节部分，选择偏向文本时，将根据输入文本的语义完善结果细节，更符合文本语境；选择偏向角色时，将更注重还原声音角色样本的直接表现力。
* **生成种子**：控制生成时的随机性，相同的种子会在生成时产生相似的结果，这个值可由 1至 2147483647 的整数。默认设置为-1 时完全随机。通常不需要调整。
* **语速**：控制生成语音的速度，值越大，语速越快，可调整为0.5x到2x之间的数值，1为正常语速

</details>

<details>

<summary>V3.0 系列模型新增的独特配置</summary>

<figure><img src="https://2881656171-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FrtJIeAMh6zzGbD77k1uX%2Fuploads%2FfkkPv8l5pWf7Uqst91Na%2FQQ_1755846123400.png?alt=media&#x26;token=b7f1058d-08e2-4cc9-b2f3-7b03bdf58161" alt="" width="563"><figcaption></figcaption></figure>

**在 V3.0 系列模型中，我们新增了一些独特参数，分配有 V3.0 模型角色的段落将可额外控制以下设置：**

* **语言选择：**&#x6307;定段落中内容的语言。默认情况下系统可自动识别输入内容的语言，如出现识别不够精准的情况或您输入的语言为粤语时，请手动选择语言。（目前暂时无法自动识别粤语内容）
* **生动表达：**&#x652F;持为单个段落单独启用“生动表达”选项。启用后，模型将基于对内容的理解拓展表现范围，使语句更具表现力和感染力（对日语ASMR效果最佳），但可能降低生成稳定性。
* **情感比例：**&#x8FD9;一功能参数能够让您调节段落发音的情感倾向，启用该功能后，您可手动指定情感比例，包括生气、开心、中立、难过、匹配上下文几种，模型将根据设置的比例尝试以对应情感表现进行发音，具体效果因不同样本可能区别较大，且可能降低生成稳定性。
* **一致性优化**：**实验功能**，启用后将优化汇集在单个段落中的长篇内容生成效果，提升一致性与连贯性，但可能降低表现力。对于文本内容的编辑，可参见[文本内容编辑](https://docs.vocu.ai/zh/~/revisions/UXeoxR8p2d7pY0hBgCpM/generate/text-edit)进行了解。
* **后处理模式：实验功能，**&#x8BE5;项目控制输出优化策略，默认将针对角色声音的还原度进行优化。此外，不同的选项可调节最终音频的听感表现，您可根据需要来尝试调整此项设置。

</details>

在最新的配置模板下，您只需在输入内容并分配角色后，点击下方的**开始生成**按钮即可提交语音生成任务，并能够实时观察到生成的进展，以及快速试听段落和整体的效果。

#### 任务队列 <a href="#task-queue" id="task-queue"></a>

[查看详细介绍](https://docs.vocu.ai/zh/generate/queue)

您可以在此处查看并管理您正在进行中的生成任务，以及所有历史任务的状态。任务的状态将实时更新，您无需手动刷新。在您开始了一个新的生成任务后，您可在编辑器中看到每个段落的任务状态，在打开任务队列后（时钟图标），您的最新任务将出现在列表最上方。

您可以点击查看列表中[每个任务的详情](https://docs.vocu.ai/zh/generate/task-detail)，播放每个任务的最终生成结果（如果有），或在每个任务的下拉菜单中快速进行音频下载、复制到编辑器、删除任务历史等操作。

每个段落的任务记录是可独立查看，方便您进行单个段落的调整。

{% hint style="info" %}
您可以在项目的编辑器中看到看每个段落的生成状态，并单独播放或下载某个段落的音频。我们还支持对单个段落进行重新生成，且不会影响其它段落的状态。
{% endhint %}
