非语音噪音或声音识别软件？

Question

我正在为儿童开发一些软件,并希望增加软件能够响应一些非语音的声音.例如,鼓掌,吠叫,吹口哨,屁声等.

我过去曾经使用过CMU Sphinx和Windows Speech API,但据我所知,这些都不支持非语音噪音,实际上我相信它会主动过滤它们.

一般来说,我正在寻找"我如何获得此功能",但我怀疑如果我将其分解为三个问题可能有所帮助,这些问题是我猜测下一步要搜索的内容:

有没有办法使用其中一个主要的语音识别引擎通过改变声学模型或发音词典来识别非单词声音？
(或)是否已有现有的图书馆进行非文字噪音识别？
(或)我对隐藏马尔可夫模型和大学语音识别的基础技术有一点熟悉,但没有很好的估计从头开始创建一个非常小的噪音/声音识别器是多么困难(假设<20噪声到被承认).如果1)和2)失败,任何估计需要多长时间才能推出自己的？

谢谢

Answer 1

我不知道您可以使用任何现有的库，我怀疑您可能必须推出自己的库。

这篇论文会引起兴趣吗？它有一些技术细节，他们似乎能够识别鼓掌并将其与口哨声区分开来。