这本书《语音增强理论与实践》挺适合对语音感兴趣的朋友。它涵盖了从理论到实际应用的广泛内容,语言也比较易懂,适合入门和有一定基础的开发者。书中对语音增强的各种算法进行了详细,尤其是对噪声消除、回声抑制等技术有好的实操指导。嗯,里面的一些案例也蛮实用的,基本可以直接上手。总体来说,是一本值得收藏的书。
Actionscript 0 次浏览
C#语音通信开源框架,语音处理,杂音过滤,语音编码,支持大部分编码。支持回音处理,发现是最好的框架了,很多通信软件都用这个框架NSpeex。找了很久啊,方便后来者工作学习。
C# 21 次浏览
iOS 开发中,图片和音频下载是常见需求,尤其是 AMR 语音文件时,难点还挺多,比如下载、存储和播放的逻辑怎么清楚。这篇分享用 Objective-C 一步步拆解了这些问题,代码清晰,思路也好理解。 比如用NSURLSession下载文件,结合NSURLSessionDataTask,轻松搞定网络
IOS 0 次浏览
C# 语音处理:利用科大讯飞 SDK 实现 介绍如何利用科大讯飞 SDK 在 C# 中实现语音合成与识别等功能。文章将重点阐述 SDK 的核心功能和使用方法,并辅以代码示例,帮助开发者快速上手。 // 示例代码:语音合成 // ... // 示例代码:语音识别 // ... 注意: 以上代码仅供
C# 21 次浏览
这份语音处理源代码来自加州圣迭戈大学,提供 MFCC 和 AMDF 等语音提取算法。
C++ 21 次浏览
语音切割:可以按照毫秒,秒,分进行批量的语音切割,切割音频自动编号并保存。读者可以设置切割的开始时间与结束时间,本代码还可用于指定每个音频的切割开始时间与结束时间都不相同的情况,可以批量读取excel中的切割的开始时间与结束时间。语音合并拼接:可以拼接多个音频,可以获取待拼接音频的路径,根据路径进行
Python 22 次浏览
代码:稍微修改了ispeech.org的例子程序,把英文语言,修改为中文语言。功能:使用ispeech.org的BlackBerry API进行TTS(文本到语音),语音到命令的操作。注意:编译项目的时候,你需要去ispeech.org网站上免费申请API Key,替换掉iSpeechSample.
BlackBerry 20 次浏览
简单的讯飞语音云端语音听写和语音合成,能够即时的停止语音听写和语音合成。方便各位读者了解一下讯飞语音的基本用法。
Android 19 次浏览
在标准的电话系统中, 通常认为能够发出的最高频率是4 kHz, 根据奈奎斯特定理, 采样频率需要达到8 kHz。如果没有采用u率或A率的压缩和扩展及均匀量化方法, 每个采样点至少需要12位数据量来表示声音信息然而, 通过应用适当的压缩技术可以在保持相同音质的情况下将每样品的位数减少到8位。这样, 数
Perl 19 次浏览