音频筑基:巴克谱和梅尔谱辨析

音频筑基:巴克谱和梅尔谱辨析

在音频信号处理中,巴克谱和梅尔谱是我们经常遇到的概念,也是语音处理中常用到的频域特征,这里谈谈自己对它们的理解。

是什么


巴克谱又称Bark Spectrum,梅尔谱又称Mel Spectrum,其中异同梳理如下:

  • 相同点:
    • Bark谱和Mel谱都是将线性频谱映射到非线性谱上的表征,根据不同频带的感知能力来划分,但它们的核心思想不同。
    • 这两种谱都是语音信号处理中常用的特征提取方法,它们可以用于基频、降噪、编解码、特殊声音检测等领域。
  • 不同点:
    • 机理不同:
      • BFCC(Bark-Frequency Cepstral Coefficents),人耳对响度感知灵敏度确定的频带划分方法, amplitude/loudness
      • MFCC(MelScale-Frequency Cepstral Coefficents),人耳对音高感知灵敏度确定的频带划分方法, pitch
    • 映射函数不同:
      • Bark谱将线性频谱映射到Bark域上,以符合人耳听觉机理。在Bark域上分布是非线性的。Bark谱通常基于MDCT弄的,常用于编解码领域。
      • Mel谱将线性频谱映射到Mel频率域(对数log)上,以模拟人类听觉系统机理。在Mel频域上,分布是线性的。Mel谱通常基于STFT弄的,使用更广泛。
    • 两者的区别在于映射函数不同,Bark谱的映射函数是非线性的,而Mel谱的映射函数是线性的。

深入了解


巴克谱/bark刻度具体如何解释?

  • bark刻度指的是频点分带策略按人耳听觉感知特性,对0-15500Hz频点从听感上进行等间距划分24个带,低于500Hz的bark刻度近似线性,高于500Hz的bark刻度近似对数尺度。
  • bark谱划分最高到15.5kHz,若到20kHz需增加为25个带(15.5-20k)
  • bark谱的关键在于临界带的宽度,而非具体位置

相关参考


  1. 语音特征小结 - 知乎 (zhihu.com)],link
  2. 音频处理中的尺度–Bark尺度与Mel尺度_bark(巴克)频率尺度-CSDN博客,link
  3. Bark谱维基百科,link

相关推荐

  1. 音频辨析

    2024-01-07 03:40:02       66 阅读
  2. 音频:基音、共振峰

    2024-01-07 03:40:02       90 阅读
  3. 音频:算法时延分析

    2024-01-07 03:40:02       57 阅读
  4. 音频:入门50问

    2024-01-07 03:40:02       33 阅读
  5. 音频:100字说清哈曼曲线的WhyWhat

    2024-01-07 03:40:02       31 阅读
  6. 音频:信噪比SNR指标

    2024-01-07 03:40:02       64 阅读
  7. 音频:总谐波失真THD+N指标

    2024-01-07 03:40:02       78 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-07 03:40:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-07 03:40:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-07 03:40:02       87 阅读
  4. Python语言-面向对象

    2024-01-07 03:40:02       96 阅读

热门阅读

  1. 读书之深入理解ffmpeg_简单笔记2(初步)

    2024-01-07 03:40:02       57 阅读
  2. 如何在 C# 12 中使用主构造函数

    2024-01-07 03:40:02       48 阅读
  3. Oracle-PLSQL

    2024-01-07 03:40:02       60 阅读
  4. Mysql数据库

    2024-01-07 03:40:02       59 阅读
  5. 练习-双指针的使用

    2024-01-07 03:40:02       56 阅读
  6. 快速删除node_modules文件夹

    2024-01-07 03:40:02       60 阅读
  7. 面试指南:指针

    2024-01-07 03:40:02       67 阅读