CosyVoice实现声音复刻

2024-07-22 21:50:02
开发
17

阿里发布了CosyVoice和SenseVoice一个是文本转语音，一个是语音转文本，不过与之前测试的ChatTTS不同的是，CosyVoice提供了声音复刻的功能，也就是上传或者录入一个人的音色，他可以学会并转化成你想要说的话，，下面可以来实践一下。

因为这个项目非常大，也需要安装各种包，这里直接用docker运行整合包来搭建环境，整合包下载后是个tar格式，大概处理流程是:

导入镜像

docker load -i cosyvoice.tar

创建容器

docker run -d --name cosyvoice --gpus all -p 8000:8000 cosyvoice:1

启动服务

docker start cosyvoice

需要注意的是，如果没有nvidia的显卡，可能会运行出错，不过可以使用下面的命令启动他是使用CPU的方式进行处理的：

docker run -d --name cosyvoice -p 8000:8000 cosyvoice:1

下面就可以用docker运行部署了；因为这里映射的是8000端口，部署后，打开127.0.0.1:8000

页面可以看到提供四种模式，第一个是训练音色，第二个是3s极速复刻，第三个是跨语种复刻，第四个是自然语言复刻，这里我们选择第二种，并找一段声音上传上去，

这里一共有5个地方需要操作，第一个输入合成文本就是你想要音色模拟你说的内容，下面选择推理模式为3s极速复刻，第三个是需要上传一段音频文件，如果没有音频文件也可以选择右侧的录音，实时录一段就可以了，下面输入prompt文本是指录音的内容转成文本放进去，方便程序比对声音读的音色，全部完成后下面选择生成音频就可以等待生成了，生成时间根据GPU性能决定。

本想上传原语音与转化后对比，但是CSDN不支持mp3格式，不过大家可以试试，这是我有史以来用过最nice的语音复刻软件

原文地址:https://blog.csdn.net/qq_26881073/article/details/140617911 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1815383805649883136.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-07-22 21:50:02 69 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-22 21:50:02 57 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-22 21:50:02 52 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-22 21:50:02 54 阅读
NoSQL之Redis非关系型数据库

2024-07-22 21:50:02 61 阅读
2024.7.22 作业

2024-07-22 21:50:02 61 阅读
GDB调试正在运行的程序

2024-07-22 21:50:02 46 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-22 21:50:02 49 阅读
在Django里面运行非项目文件

2024-07-22 21:50:02 45 阅读
SSD基本架构与工作原理

2024-07-22 21:50:02 52 阅读
在誉天学习完HCIE就业吗？

2024-07-22 21:50:02 58 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-22 21:50:02 49 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-22 21:50:02 51 阅读
go 协程池的实现

2024-07-22 21:50:02 50 阅读
Shell脚本循环语句与函数

2024-07-22 21:50:02 51 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-22 21:50:02 55 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-22 21:50:02 50 阅读
四大引用——强软弱虚

2024-07-22 21:50:02 54 阅读
Python语言-面向对象

2024-07-22 21:50:02 55 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-22 21:50:02 50 阅读
网站安全-CDN篇

2024-07-22 21:50:02 51 阅读

热门阅读

分享 | 金融机构的标配：全渠道反欺诈平台

2024-07-22 21:50:02 17 阅读
redis常用指令

2024-07-22 21:50:02 15 阅读
智能知识问答-递归字符文本分割器

2024-07-22 21:50:02 14 阅读
【计算机网络】TCP/IP——流量控制与拥塞控制

2024-07-22 21:50:02 15 阅读
IEEE Transactions on Vehicular Technology (TVT) 投稿状态记录

2024-07-22 21:50:02 17 阅读
排查一次线程泄漏

2024-07-22 21:50:02 15 阅读
多站点环境下Memcached的配置与管理

2024-07-22 21:50:02 18 阅读
Verilog语言和C语言的本质区别是什么？

2024-07-22 21:50:02 18 阅读
7月21日，贪心练习

2024-07-22 21:50:02 16 阅读
Vue3 深入组件

2024-07-22 21:50:02 16 阅读
Qt绘制指南针（仪表盘绘制封装使用）

2024-07-22 21:50:02 13 阅读
stm32入门-----EXTI外部中断（下——实践篇）

2024-07-22 21:50:02 13 阅读
CMake入门

2024-07-22 21:50:02 15 阅读
go-kratos 学习笔记(4) 服务注册与发现 nacos注册

2024-07-22 21:50:02 18 阅读
BSV区块链技术现实应用原理解析

2024-07-22 21:50:02 17 阅读
HTTP 缓存

2024-07-22 21:50:02 17 阅读
动态特征转换的艺术：在Mojo模型中实现自定义变换的策略

2024-07-22 21:50:02 14 阅读
Leetcode热题100 Day4

2024-07-22 21:50:02 16 阅读
Python每日学习

2024-07-22 21:50:02 15 阅读
web前端 React 框架面试200题（七）

2024-07-22 21:50:02 15 阅读
IPC进程间通信

2024-07-22 21:50:02 15 阅读
python+flask计算机毕业设计基于智能匹配的体育场馆预约系统App（程序+开题+论文）

2024-07-22 21:50:02 12 阅读
鸡兔同笼求解器

2024-07-22 21:50:02 17 阅读
Elastic 及阿里云 AI 搜索 Tech Day 将于 7 月 27 日在上海举办

2024-07-22 21:50:02 15 阅读
产线中有MES系统还有安装SCADA的必要吗？

2024-07-22 21:50:02 18 阅读
深入分析 Android ContentProvider (三)

2024-07-22 21:50:02 17 阅读
前端的学习-HTML

2024-07-22 21:50:02 13 阅读
多租户分库分表同步数据库DDL脚本

2024-07-22 21:50:02 13 阅读
深度学习中的损失函数和网络优化方法

2024-07-22 21:50:02 13 阅读
QML学习——Qt Quick Controls 1 Examples Calendar/FileSystemBrowser（九）

2024-07-22 21:50:02 14 阅读