pytorch对音频数据的读取和保存

2024-04-29 12:14:02
开发
31

torchaudio是PyTorch深度学习框架的一部分，主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口，使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。
通过使用torchaudio，开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式，并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外，torchaudio还支持多声道音频处理和GPU加速，以满足不同应用场景的需求。
torchaudio.load读取音频文件：

import torchaudio
file_path = "xx/xx.wav"
waveform, sr = torchaudio.load(file_path, normalize=True)

主要说明：
可以读取float32, int16, int32类型数据，返回的是torch.tensor类型的数据；
normalize=True时，返回的数据是归一化到(-1,1)的float32数据；
normalize=False时，返回的是float32、int16或者int32数据，具体需要看file_path本身是什么类型的音频数据；
normalize默认值为True。

torchaudio.save保存音频文件

# out_path, 保存的音频文件路径，waveform保存的数据，sr是采样率
torchaudio.save(out_path, waveform, sr)

根据waveform的格式自动保存为float32、int16或者int32

原文地址:https://blog.csdn.net/zly_Always_be/article/details/138289584 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1784798271298998272.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-04-29 12:14:02 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-29 12:14:02 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-29 12:14:02 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-29 12:14:02 100 阅读
NoSQL之Redis非关系型数据库

2024-04-29 12:14:02 101 阅读
2024.7.22 作业

2024-04-29 12:14:02 96 阅读
GDB调试正在运行的程序

2024-04-29 12:14:02 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-29 12:14:02 85 阅读
在Django里面运行非项目文件

2024-04-29 12:14:02 82 阅读
SSD基本架构与工作原理

2024-04-29 12:14:02 87 阅读
在誉天学习完HCIE就业吗？

2024-04-29 12:14:02 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-29 12:14:02 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-29 12:14:02 85 阅读
go 协程池的实现

2024-04-29 12:14:02 88 阅读
Shell脚本循环语句与函数

2024-04-29 12:14:02 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-29 12:14:02 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-29 12:14:02 85 阅读
四大引用——强软弱虚

2024-04-29 12:14:02 86 阅读
Python语言-面向对象

2024-04-29 12:14:02 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-29 12:14:02 85 阅读
网站安全-CDN篇

2024-04-29 12:14:02 88 阅读

热门阅读

PyCharm 无法运行的解决方案

2024-04-29 12:14:02 30 阅读
百度测试|测试开发面试真题|面经汇总

2024-04-29 12:14:02 23 阅读
Linux深入学习 - 进程

2024-04-29 12:14:02 34 阅读
stm32 boot脚设计

2024-04-29 12:14:02 25 阅读
与 Apollo 共创生态: Apollo7周年大会带给我的启发和心得

2024-04-29 12:14:02 29 阅读
机器学习：基于Sklearn框架，使用逻辑回归对由心脏病引发的死亡进行预测分析

2024-04-29 12:14:02 35 阅读
Qt xml示范

2024-04-29 12:14:02 30 阅读
FreeLearning Golang 译文集翻译完成

2024-04-29 12:14:02 31 阅读
4月28_学习C语言知识(初识)

2024-04-29 12:14:02 31 阅读
$计算机网络之传输层TCP\UDP协议 TCP可靠传输$

计算机网络之传输层TCP\UDP协议 TCP可靠传输

2024-04-29 12:14:02 30 阅读
【论文精读】多模态系列：ALBEF、VLMo、BLIP、CoCa、BeiTv3

2024-04-29 12:14:02 36 阅读
esp32s3使用psram后音频播报不了的问题解决记录

2024-04-29 12:14:02 34 阅读
在ubuntu 24.04 上安装vmware workstation 17.5.1

2024-04-29 12:14:02 26 阅读
C++——数据类型笔记

2024-04-29 12:14:02 23 阅读
python常用库函数

2024-04-29 12:14:02 23 阅读
HTTP状态码详细解读

2024-04-29 12:14:02 28 阅读
C语言真题20套

2024-04-29 12:14:02 26 阅读
213. 打家劫舍 II

2024-04-29 12:14:02 27 阅读
霍兰德职业兴趣测试：高考生如何根据自身兴趣选择合适的专业？

2024-04-29 12:14:02 33 阅读
Python医院挂号脚本

2024-04-29 12:14:02 32 阅读
蓝桥杯每日一题：空调（差分）

2024-04-29 12:14:02 23 阅读
Pytorch与深度学习

2024-04-29 12:14:02 29 阅读
ubuntu+Paddle Inference GPU C++部署

2024-04-29 12:14:02 36 阅读
学习 Rust 的第五天：了解程序的基本控制流程

2024-04-29 12:14:02 28 阅读
冷热数据分离方案

2024-04-29 12:14:02 30 阅读
2023年图灵奖揭晓：Avi Wigderson的理论计算贡献与影响

2024-04-29 12:14:02 36 阅读
typedef,#define,asserr，exit函数，free函数

2024-04-29 12:14:02 27 阅读
minio主从同步和双机热备

2024-04-29 12:14:02 28 阅读
YOLOv8优改系列二：YOLOv8融合ATSS标签分配策略，实现网络快速涨点

2024-04-29 12:14:02 23 阅读
探索Vue 3 reactive()原理及其实现步骤

2024-04-29 12:14:02 34 阅读