中文语音识别实战(ASR)

写在前面的话

本博客主要介绍了

1. 语音识别基础知识

2. 中文语音识别数据集

3. 语音识别常用模型方法

4. 自己训练一个中文语音识别模型

主意: 代码中所涉及的模型及数据集,均可从huggingface下载得到,代码中的路劲,需要根据自身实际情况稍做调整。

目录

语音识别基础

数据集

模型

wav2vec

whipser

训练代码

工具代码

推理代码

单条推理

参考


语音识别基础

音视频开发基础入门|声音的采集与量化、音频数字信号质量、音频码率_量化后的声音信号-CSDN博客

https://huggingface.co/learn/audio-course/chapter1/audio_data

数据集

common_voice

包含大陆,香港,台湾等地的语音数据。

https://huggingface.co/datasets/fsicoli/common_voice_17_0

其它

webhub123

模型

wav2vec

相关推荐

  1. 中文语音识别实战ASR

    2024-04-26 09:30:05       11 阅读
  2. Python使用whisper实现语音识别ASR

    2024-04-26 09:30:05       15 阅读
  3. python中文语音识别

    2024-04-26 09:30:05       52 阅读
  4. ASR语音识别纠错-fast correct

    2024-04-26 09:30:05       17 阅读
  5. 基于Asterisk和TTS/ASR语音识别的配置示例

    2024-04-26 09:30:05       36 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-04-26 09:30:05       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-26 09:30:05       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-26 09:30:05       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-26 09:30:05       18 阅读

热门阅读

  1. Spring

    Spring

    2024-04-26 09:30:05      9 阅读
  2. 【早晨读书会】深入理解rust并发编程

    2024-04-26 09:30:05       9 阅读
  3. FM33256

    2024-04-26 09:30:05       9 阅读
  4. Mac安装flutter环境

    2024-04-26 09:30:05       12 阅读
  5. 【HTML】

    2024-04-26 09:30:05       9 阅读
  6. 在Vue中如何渲染使用Vue写法的HTML文件?

    2024-04-26 09:30:05       12 阅读
  7. Quartz是如何实现数据库行锁的,是如何获取锁

    2024-04-26 09:30:05       9 阅读
  8. HTML文本域如何设置为禁止用户手动拖动

    2024-04-26 09:30:05       10 阅读
  9. 单链表的查询

    2024-04-26 09:30:05       10 阅读