MFCC_Feature_Extraction_in_MATLAB

MFCC(Mel Frequency Cepstral Coefficients, 梅尔频率倒谱系数)是一种模仿人类听觉系统的频域特征提取技术,常用于语音识别和分析,以下是MATLAB中计算MFCC的主要步骤:

1. 预加重

通过一阶滤波器提升高频,以减少低频对高频成分的掩盖。

2. 分帧

将语音信号划分成多个20-30毫秒的短帧,以捕捉语音特征。

3. 窗口函数

对每帧应用窗函数(如汉明窗),减少边界效应。

4. 傅立叶变换

将时域信号转换到频域表示。

5. 梅尔滤波器组

利用梅尔尺度滤波器,模拟人耳频率敏感性,使高频处的滤波器间隔更密集。

6. 对数运算

对梅尔滤波器输出取对数,模拟人耳的对数感知。

7. 离散余弦变换(DCT)

提取主要频谱特征并保留前12-20个MFCC系数。

8. 动态特征

计算MFCC的一阶差分(Δ)和二阶差分(ΔΔ)以反映时变特性。

MATLAB工具箱内的audio Toolbox或自定义代码均能有效实现这些步骤,通过参数设置优化MFCC提取效果。在语音识别中,MFCC用于提供声学特征,与HMM或深度学习模型结合,提升识别率。

rar 文件大小:408.59KB