相关疑难解决方法(0)

声音样本识别库/代码

我不想要声音到文本的软件.我需要的是以下内容:

  • 我将录制多个(比如50多个)音频流(无线电台的录音)
  • 从那些录音中,我将标记有趣的音频片段 - 它们的长度范围从2到60秒 - 将有数千个这样的音频片段
  • 库应该能够从录制的声音流中找到相同音频片段的其他实例
  • 应报告使用的置信因子和提供的额外输入,以便下次识别可以更好地执行

你知道这样的软件库吗?LGPL对我来说最有价值,但我也可以获得商业许可.

音频剪辑将包含音乐,文本,效果或其任何组合.因此,TEXT识别是不可能的.

架构:c ++,C#用于粘合,CUDA(如果可能).

audio signal-processing audio-processing

14
推荐指数
2
解决办法
2万
查看次数

非语音噪音或声音识别软件?

我正在为儿童开发一些软件,并希望增加软件能够响应一些非语音的声音.例如,鼓掌,吠叫,吹口哨,屁声等.

我过去曾经使用过CMU Sphinx和Windows Speech API,但据我所知,这些都不支持非语音噪音,实际上我相信它会主动过滤它们.

一般来说,我正在寻找"我如何获得此功能",但我怀疑如果我将其分解为三个问题可能有所帮助,这些问题是我猜测下一步要搜索的内容:

  1. 有没有办法使用其中一个主要的语音识别引擎通过改变声学模型或发音词典来识别非单词声音?
  2. (或)是否已有现有的图书馆进行非文字噪音识别?
  3. (或)我对隐藏马尔可夫模型和大学语音识别的基础技术有一点熟悉,但没有很好的估计从头开始创建一个非常小的噪音/声音识别器是多么困难(假设<20噪声到被承认).如果1)和2)失败,任何估计需要多长时间才能推出自己的?

谢谢

api audio speech-recognition cross-platform microphone

5
推荐指数
1
解决办法
2592
查看次数