相关疑难解决方法(0)

我不想要声音到文本的软件.我需要的是以下内容:

你知道这样的软件库吗？LGPL对我来说最有价值,但我也可以获得商业许可.

音频剪辑将包含音乐,文本,效果或其任何组合.因此,TEXT识别是不可能的.

架构:c ++,C#用于粘合,CUDA(如果可能).

14
推荐指数

2
解决办法

2万
查看次数

我正在为儿童开发一些软件,并希望增加软件能够响应一些非语音的声音.例如,鼓掌,吠叫,吹口哨,屁声等.

我过去曾经使用过CMU Sphinx和Windows Speech API,但据我所知,这些都不支持非语音噪音,实际上我相信它会主动过滤它们.

一般来说,我正在寻找"我如何获得此功能",但我怀疑如果我将其分解为三个问题可能有所帮助,这些问题是我猜测下一步要搜索的内容:

有没有办法使用其中一个主要的语音识别引擎通过改变声学模型或发音词典来识别非单词声音？
(或)是否已有现有的图书馆进行非文字噪音识别？
(或)我对隐藏马尔可夫模型和大学语音识别的基础技术有一点熟悉,但没有很好的估计从头开始创建一个非常小的噪音/声音识别器是多么困难(假设<20噪声到被承认).如果1)和2)失败,任何估计需要多长时间才能推出自己的？

谢谢

5
推荐指数

1
解决办法

2592
查看次数