GPT-SoVITS语音克隆入门

主要参考资料:
GPT-SoVITS: 智能语音合成的新境界: https://blog.csdn.net/weixin_36829761/article/details/140169895
你的声音,现在是我的了!- 手把手教你用 GPT-SoVITS 克隆声音!: https://www.bilibili.com/video/BV1P541117yn/?spm_id_from=333.337.search-card.all.click&vd_source=ef5b6d43cf1d4ed823db3e9133e97d2d

一、安装GPT-SoVITS(基于Windows)

二、参数设置

2.0 前置数据集获取工具

0a.准备音频
如果采集的数据里有背景噪声,可以打开UVR5,等待一会,会弹出一个新的页面
在这里插入图片描述

根据文字提示,选择对应的模型,点击转换
在这里插入图片描述
0b.切割音频
修改下输入输出路径,第一次玩其他参数可以先选默认。
在这里插入图片描述
0c.打标
这一步我们获得识别结果,但为了得到更好的效果,下一步我们需要对打标结果进行校正。
在这里插入图片描述
0d.校对
打勾开启打标WebUI,注意文件路径。
在这里插入图片描述
校对完成后保存文件。
在这里插入图片描述

2.1 GPT-SoVITS-TTS

回到顶层,切换到1-GPT-SoVITS-TTS
在这里插入图片描述

2.1.A 训练集格式化工具

继续填好路径,其他可以默认。
在这里插入图片描述
点击一键三连
在这里插入图片描述

2.1.B 微调训练

回到顶部,切换到1B-微调训练
在这里插入图片描述
依次点击 开启SoVITS训练 和 开始GPT训练
在这里插入图片描述

2.1.C 推理

选择两个模型,并开启TTS推理
在这里插入图片描述
这里还需要先上传一个参考音频,可以在切割的音频里选择
在这里插入图片描述

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-17 15:18:05       49 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-17 15:18:05       53 阅读
  3. 在Django里面运行非项目文件

    2024-07-17 15:18:05       42 阅读
  4. Python语言-面向对象

    2024-07-17 15:18:05       53 阅读

热门阅读

  1. AI技术在企业招聘中的应用案例分析

    2024-07-17 15:18:05       22 阅读
  2. 土土土土土土土土圭

    2024-07-17 15:18:05       19 阅读
  3. ElasticSearch学习之路

    2024-07-17 15:18:05       18 阅读
  4. android include 和 merge 区别

    2024-07-17 15:18:05       15 阅读
  5. python基础篇(12):继承

    2024-07-17 15:18:05       21 阅读
  6. Spring解决循环依赖问题的四种方法

    2024-07-17 15:18:05       13 阅读
  7. 人工智能与人类社会的共生共荣

    2024-07-17 15:18:05       17 阅读
  8. Catboost 不能做多变量回归?

    2024-07-17 15:18:05       17 阅读
  9. Qt将毫秒转化为时分秒格式

    2024-07-17 15:18:05       19 阅读