# 概览

您可以通过创建一个角色，并为其上传或录制一段简短的音频样本，来进行[瞬时语音克隆](/zh/voices/create.md)。您也可以通过提供1-60分钟的音频样本，来在3-60分钟内完成[专业语音克隆](/zh/voices/pro-clone.md)。

随后，您就可以在语音合成中将这些角色分配给不同的文本，来让AI使用这些角色的声音进行朗读。

目前，您可以通过[角色管理](https://app.vocu.ai/voices)页面&#x7684;**"添加角色"**&#x6309;钮，或者在[配音工作室](https://app.vocu.ai/generate)页面中选择角色时的弹窗中选择"**创建新角色..."**&#x6309;钮来召唤出角色创建面板，并用其来创建一个角色。

### 瞬时克隆

[瞬时克隆](/zh/voices/create.md)允许您几乎瞬时地从非常短的样本中克隆一个声音。需要说明的是，瞬时克隆的基本原理并不是根据提供的声音样本创建或训练一个新的模型，而是让AI根据其曾经学习过的海量数据来合理地进行推测和模仿。我们的模型经受过大量常规语音的训练，因此对于大部分自然的语音处理理论上十分有效。

然而，我们的模型依然存在一些不完美之处，如果您提供的声音样本较为独特，我们的AI曾经没有学习过类似的声音，则可能导致较差的生成结果，或无法较好的复刻该声音。目前，对于我们各个模型的具体介绍、缺点与局限性，请参见[模型介绍](/zh/introduction/models.md)

{% hint style="info" %}
样本质量比长度更重要。有噪音的样本可能会产生不好的结果，请尽可能提供高质量的样本语音。目前，样本语音长度需**大于2秒**，且**文件大小不超过20M**。您也可以通过一些**音频编辑软件**的**人声分离/音频降噪/人声美化/响度标准化**等功能来尝试从任意音频中获得较高质量的人声音频样本。
{% endhint %}

### 专业克隆

通过[专业级语音克隆](/zh/voices/pro-clone.md)，您只需提供一分钟或更长（最长支持60分钟）的声音样本，我们的AI将会在3-60分钟内深入训练学习您所提供的声音样本的每一个语调、发音方式、节奏、韵律等各项细节，实现与原声无法区分的顶尖克隆合成效果，并同时保留Vocu语音大模型的语言理解力、情感表现力等所有尖端特性。

{% hint style="warning" %}
V2 系列版本的模&#x578B;**(V2.9) 仅支持中文与英文**，使用 V2 系列模型时请确保输入的文本中不包含任何非中英文字符，例如日文韩文等，否则可能会导致**生成失败**等问题。

自 V3 系列开始，我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语，以及这些语言的共计30余种口音变体；请确保您使用的模型版本及文本内容输入符合对应的支持能力。
{% endhint %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.vocu.ai/zh/voices/overview.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
