声音的本质是波动,波形图能直观体现声音的特征。我们常用于描述音频的属性有下面这些:
1.采样率:声音中每秒包含的采样点个数。
2.位宽:每个采样点需要多少个bit进行存储。
3.声道数:声音进行回放需要喇叭的个数。
4.频率:声波每秒中包含的周期数。
5.周期:声波两个波峰之间的时间差。
我们看到的波形图一般都是连续的,但在计算机中用于描述声音的是离散的点,连续的波形是通过对这些离散的点进行插值得到。这些点就是常说的采样点。
PCM数据:脉冲编码调制。将模拟信号的声音直接编码成数字信号,最原始的音频数据。从软件
角度看,PCM数据就是能直接进行播放的最基础的音频格式。
当我们知道一段音频 PCM数据的数据量(bytes),声道数(channels),位宽(bitwidth),采样率(samplerate)时,
就可以计算出这段音频数据能播放多长时间。播放时长time = bytes / (bitwidth / 8) / samplerate / channels.
播放时长主要可以用于以下这两种场景:
1.判断数据发送端是否欠载:若数据发送端在时间time_real发送到数据接收端的音频PCM数据对应的时长time_data存在下面的情况时,则数据发送端发送数据不及时。time_real > time_data。
2.算法处理性能不足:若算法处理模块处理一段时长time_data的音频数据花费time_alg存在下面的情况时,则算法性能不足。time_alg > time_data。