kak*_*aki 4 java audio speech-recognition
我正在研究语音识别器项目,因为它希望从wav文件中找到存在的静音或检测到单词的存在.如果找到一个单词,则将该单词从头到尾复制到新的wav中文件所以它原来的wav文件有10个单词然后输出是10个文件..问题是检测沉默或单词想要如何在java中实现这个...请建议..
好吧,wav只是PCM数据.我首先阅读这篇文章:http: //en.wikipedia.org/wiki/Pulse-code_modulation
我之前已经这样做了......你开始从PCM数据中提取样本.然后检查每个以查看它是否大于您设置的阈值.例如假设16位样本...示例从0到15000的任何值都是静音,大于15001的任何值都是声音.只记得处理无符号的整数或者你在PCM中会有负数.此外,当您正在玩阈值时,请记住log vs linear.
| 归档时间: |
|
| 查看次数: |
4063 次 |
| 最近记录: |