pytorch对音频数据的读取和保存

  torchaudio是PyTorch深度学习框架的一部分,主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口,使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。
  通过使用torchaudio,开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式,并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外,torchaudio还支持多声道音频处理和GPU加速,以满足不同应用场景的需求。
  torchaudio.load读取音频文件:

import torchaudio
file_path = "xx/xx.wav"
waveform, sr = torchaudio.load(file_path, normalize=True)

主要说明:
可以读取float32, int16, int32类型数据,返回的是torch.tensor类型的数据;
normalize=True时,返回的数据是归一化到(-1,1)的float32数据;
normalize=False时,返回的是float32、int16或者int32数据,具体需要看file_path本身是什么类型的音频数据;
normalize默认值为True。

  torchaudio.save保存音频文件

# out_path, 保存的音频文件路径,waveform保存的数据,sr是采样率
torchaudio.save(out_path, waveform, sr)

根据waveform的格式自动保存为float32、int16或者int32

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-29 12:14:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-29 12:14:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-29 12:14:02       82 阅读
  4. Python语言-面向对象

    2024-04-29 12:14:02       91 阅读

热门阅读

  1. Linux深入学习 - 进程

    2024-04-29 12:14:02       34 阅读
  2. stm32 boot脚设计

    2024-04-29 12:14:02       25 阅读
  3. FreeLearning Golang 译文集翻译完成

    2024-04-29 12:14:02       31 阅读
  4. C++——数据类型笔记

    2024-04-29 12:14:02       23 阅读
  5. python常用库函数

    2024-04-29 12:14:02       23 阅读
  6. HTTP状态码详细解读

    2024-04-29 12:14:02       28 阅读
  7. C语言真题20套

    2024-04-29 12:14:02       26 阅读
  8. Python医院挂号脚本

    2024-04-29 12:14:02       32 阅读
  9. 蓝桥杯每日一题:空调(差分)

    2024-04-29 12:14:02       23 阅读
  10. 学习 Rust 的第五天:了解程序的基本控制流程

    2024-04-29 12:14:02       28 阅读
  11. 冷热数据分离方案

    2024-04-29 12:14:02       30 阅读
  12. typedef,#define,asserr,exit函数,free函数

    2024-04-29 12:14:02       27 阅读
  13. 探索Vue 3 reactive()原理及其实现步骤

    2024-04-29 12:14:02       34 阅读