MFCC(Mel Frequency Cepstral Coefficients, 梅尔频率倒谱系数)是一种模仿人类听觉系统的频域特征提取技术,常用于语音识别和分析,以下是MATLAB中计算MFCC的主要步骤: 1. 预加重 通过一阶滤波器提升高频,以减少低频对高频成分的掩盖。 2. 分帧 将语音信
bada 13 次浏览
基于语音信号的性别识别,推荐你看看这个资源,整体思路挺清晰的,用的是MFCC特征加SVM分类,准确率高达 98.7%,效果蛮不错。声音信号提特征这块,MFCC还是老熟人了,步骤规范,像预加重、分帧、加窗、FFT 这些全都囊括了,而且解释也挺接地气的。你要是以前搞过语音识别的话,应该能快跟上思路。分类
C++ 0 次浏览
基于语音识别的 MFCC 特征提取源码挺实用的,尤其是你在搞 ASR 系统的时候,用来提取语音的核心特征,效率高还挺靠谱。它是把声音信号一步步搞成一组数字向量,方便后续,基本上每个语音识别项目都会用到。 你可以从预加重、分帧、加窗、做 FFT,再到梅尔滤波、取对数、DCT 这些步骤,全流程都有实现,
C++ 0 次浏览
本项目运用密度聚类算法DBSCAN和划分聚类算法K-means对蛙类叫声进行物种识别。 首先,提取蛙类叫声的梅尔频率倒谱系数(MFCC)作为特征。 然后,分别使用DBSCAN和K-means算法对提取的MFCC特征进行聚类分析,区分不同科属的蛙类。 项目包含完整的代码实现和实验数据集。
Python 30 次浏览
呼吸音的 MFCC 特征提取和 SVM 分类,放在 MATLAB 里搞其实挺顺的。预用得比较多的是滤波,比如用维纳滤波,能把呼吸音里那些杂音得还不错。你用过mfcc()函数没?这个函数配合帧分割和窗口函数用起来,提特征又快又稳。 特征提完了,用SVM来分类,其实还挺靠谱的。尤其是二分类的任务,像是区
cocos2D 0 次浏览