机器学习笔记 - 文字转语音技术路线简述以及相关工具不完全清单

2024-04-07 07:12:02
开发
95

一、TTS技术简述

今天的文本到语音转换技术（TTS）的目标已经不仅仅是让机器说话，而是让它们听起来像不同年龄和性别的人类。通常，TTS 系统合成器的质量是从不同方面进行评估的，包括合成语音的清晰度、自然度和偏好，以及人类感知因素，例如可理解性。

1、技术路线

（1）基于拼接合成的方法

拼接合成（Concatenative Synthesis）的方法就是将预先录制好的语音片段存储在数据库中，根据输入文本，选择并拼接相应的语音片段来合成语音。这种方式语音质量高，自然度好。但需要大量的语音数据，灵活性较差，难以适应新的发音或语调变化。

一些开源项目Festival:、 MaryTTS、Flite等。

（2）基于参数合成的方法

参数合成(Parametric Synthesis)的方法是使用统计模型来学习语音的声学特征，并根据输入文本生成语音参数，最终合成语音。其背后的想法是，如果我们能够对构成语音的参数进行近似，我们就可以训练一个模型来生成各种语音。参数方法结合参数，包括基频、幅度谱等，并处理它们以生成语音。

第一步，处理文本以提取语言特征，例如音素或持续时间。第二步需要提取声码器特征，例如倒谱、频谱图、基频等，这些特征代表人类语音的一些固有特征

原文地址:https://blog.csdn.net/bashendixie5/article/details/137241913 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1776749735147868160.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-04-07 07:12:02 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-07 07:12:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-07 07:12:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-07 07:12:02 101 阅读
NoSQL之Redis非关系型数据库

2024-04-07 07:12:02 101 阅读
2024.7.22 作业

2024-04-07 07:12:02 98 阅读
GDB调试正在运行的程序

2024-04-07 07:12:02 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-07 07:12:02 85 阅读
在Django里面运行非项目文件

2024-04-07 07:12:02 82 阅读
SSD基本架构与工作原理

2024-04-07 07:12:02 87 阅读
在誉天学习完HCIE就业吗？

2024-04-07 07:12:02 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-07 07:12:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-07 07:12:02 86 阅读
go 协程池的实现

2024-04-07 07:12:02 89 阅读
Shell脚本循环语句与函数

2024-04-07 07:12:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-07 07:12:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-07 07:12:02 85 阅读
四大引用——强软弱虚

2024-04-07 07:12:02 86 阅读
Python语言-面向对象

2024-04-07 07:12:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-07 07:12:02 85 阅读
网站安全-CDN篇

2024-04-07 07:12:02 89 阅读

热门阅读

【数据库】SQL简介

2024-04-07 07:12:02 44 阅读
小米汽车su7全色系展示源码

2024-04-07 07:12:02 39 阅读
jenkins_Pipeline_grooy&常见的dsl

2024-04-07 07:12:02 45 阅读
torchvision中的数据集使用

2024-04-07 07:12:02 40 阅读
机器学习、深度学习中的目标函数、损失函数、梯度概念

2024-04-07 07:12:02 35 阅读
在类Unix平台实现TCP服务端

2024-04-07 07:12:02 40 阅读
人工智能研究生前置知识—jupyter notebook快速上手使用

2024-04-07 07:12:02 37 阅读
Mysql重点思考(下)--SQL 优化/慢查询

2024-04-07 07:12:02 44 阅读
【服务器部署篇】Linux下安装Docker容器

2024-04-07 07:12:02 51 阅读
数据安全之认识数据库审计系统

2024-04-07 07:12:02 47 阅读
sharding‐jdbc之分库分表实战

2024-04-07 07:12:02 32 阅读
【微信小程序】【小程序样式加载不出来】

2024-04-07 07:12:02 40 阅读
计算机网络——36加密原理

2024-04-07 07:12:02 38 阅读
后端灰度发布

2024-04-07 07:12:02 43 阅读
特征提取算法

2024-04-07 07:12:02 34 阅读
vue upgradeCommand ‘vue‘ not found, but can be installed with:snap install vue

2024-04-07 07:12:02 30 阅读
Pycharm 使用小技能1 Debug调试

2024-04-07 07:12:02 35 阅读
Axure案例分享—垂直手风琴（附下载地址）

2024-04-07 07:12:02 33 阅读
识别语序成语的简单神经网络

2024-04-07 07:12:02 35 阅读
Android10以上版本调用相机拍照

2024-04-07 07:12:02 34 阅读
【原型设计】用Axure进行数据大屏可视化设计，民政数据可视化大屏

2024-04-07 07:12:02 43 阅读
【Frida】【Android】工具篇：查壳工具大赏

2024-04-07 07:12:02 41 阅读
网络网络层之(1)IPv4地址

2024-04-07 07:12:02 29 阅读
Excel常用技巧

2024-04-07 07:12:02 30 阅读
《C++ Primer Plus》第八章总结

2024-04-07 07:12:02 35 阅读
X服务器远程连接问题解决：Bad displayname ““‘或Missing X server or $DISPLAY

2024-04-07 07:12:02 34 阅读
ARM、X86、RISC-V三分天下

2024-04-07 07:12:02 31 阅读
docker 部署 dujiaoka 独角数卡自动售货系统支持 X86 和 ARM 架构

2024-04-07 07:12:02 36 阅读
【C++ STL有序关联容器】map 映射

2024-04-07 07:12:02 29 阅读
JVM总结

2024-04-07 07:12:02 32 阅读