MFCC_Feature_Extraction_in_MATLAB
MFCC(Mel Frequency Cepstral Coefficients, 梅尔频率倒谱系数)是一种模仿人类听觉系统的频域特征提取技术,常用于语音识别和分析,以下是MATLAB中计算MFCC的主要步骤:
1. 预加重
通过一阶滤波器提升高频,以减少低频对高频成分的掩盖。
2. 分帧
将语音信号划分成多个20-30毫秒的短帧,以捕捉语音特征。
3. 窗口函数
对每帧应用窗函数(如汉明窗),减少边界效应。
4. 傅立叶变换
将时域信号转换到频域表示。
5. 梅尔滤波器组
利用梅尔尺度滤波器,模拟人耳频率敏感性,使高频处的滤波器间隔更密集。
6. 对数运算
对梅尔滤波器输出取对数,模拟人耳的对数感知。
7. 离散余弦变换(DCT)
提取主要频谱特征并保留前12-20个MFCC系数。
8. 动态特征
计算MFCC的一阶差分(Δ)和二阶差分(ΔΔ)以反映时变特性。
MATLAB工具箱内的audio Toolbox
或自定义代码均能有效实现这些步骤,通过参数设置优化MFCC提取效果。在语音识别中,MFCC用于提供声学特征,与HMM或深度学习模型结合,提升识别率。
408.59KB
文件大小:
评论区