【OpenVoice】AI语音大模型，录制声音即可定制音色

2024-07-15 11:28:02
开发
28

在这里插入图片描述
OpenVoice是一款创新的开源语音克隆与生成技术，它通过先进的深度学习算法，特别是基于Transformer结构的文本转语音（TTS）模型，实现了高精度的音色克隆和灵活的语音风格控制。该技术不仅能够在多种语言和口音中生成语音，还具备零样本跨语言声音克隆的能力，为语音合成领域带来了重大突破。OpenVoice原生支持多种语言，如英语、西班牙语、法语、中文、日语和韩语等。这种多语言支持能力使得OpenVoice在全球范围内具有广泛的应用前景。

下载和使用

搭建环境

安装python和anaconda
openvoice指定使用Python 3.9版本解析器，如果已经下载了其他版本的Python也没事，可以下载anaconda适配（anaconda 下载国内好像有点慢，如果需要安装包，在文末可以看到。只提供windows版本）
安装成功后需要配置环境变量

配置pip conda 国内镜像

# 添加清华大学镜像站频道
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
# 添加频道后需要显示频道
conda config --set show_channel_urls yes
# 查询已存在的频道
conda config --get channels

##############pip###############

# 配置使用清华镜像源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 配置信任该镜像源
pip config set install.trusted-host pypi.tuna.tsinghua.edu.cn