Sphinx开源语音识别引擎

语音识别里的老牌选手 Sphinx,开源、跨平台,还挺适合拿来做定制化项目的。它底层用的 HMM(隐马尔可夫模型),搭配特征提取工具,一套流程下来,识别效果还不错。

Sphinx 的模型训练比较灵活,自定义词库、自定义语法都可以搞。嗯,要是你用 Java 开发,用Pocketsphinx这个轻量级版本,集成还算顺畅。

如果你是 iOS 开发,可以看看iOS 语音识别iOS 语音识别方案,讲得比较细。用 MATLAB 做语音实验的同学,MATLAB 语音识别库也值得看看。

还有不少实战资源挺值得翻一翻,比如开源语音识别代码,直接上手调一调更直观;要搞统计建模的,统计方法概览挺系统。

要注意,Sphinx 识别中文的效果没那么理想,需要自己折腾模型和音频预,麻烦点。如果你只是想快速实现语音命令功能,语音识别源码那篇文章给的例子就还蛮实用的。

,如果你对语音识别底层逻辑感兴趣,或者想做离线识别的东西,Sphinx 值得试试。如果你做的是 APP 级别的功能需求,可以考虑结合其他方案灵活选用。

ppt 文件大小:2.97MB