相关疑难解决方法(0)

注意起病检测

我正在开发一个系统来帮助音乐家进行转录.目的是在单个乐器单声道录音上执行自动音乐转录(它不一定是完美的,因为用户将在以后纠正错误/错误).这里有没有人有自动音乐转录的经验?或一般的数字信号处理?无论您的背景如何,都非常感谢任何人的帮助.

到目前为止,我已经研究了使用快速傅里叶变换进行音调检测,并且MATLAB和我自己的Java测试程序中的大量测试表明它足够快速和准确以满足我的需求.需要解决的任务的另一个要素是以乐谱形式显示制作的MIDI数据,但这是我现在不关心的事情.

简而言之,我正在寻找的是一种用于音符开始检测的好方法,即信号中新音符开始的位置.由于慢速开启可能很难正确检测,我最初将使用带有钢琴录音的系统.这也部分归因于我弹钢琴的事实,应该处于更好的位置以获得合适的录音进行测试.如上所述,该系统的早期版本将用于简单的单声道录音,根据未来几周取得的进展,可能会在稍后进行更复杂的输入.

audio signal-processing onset-detection

31
推荐指数
1
解决办法
2万
查看次数

使用PocketSphinx识别多个关键字

我已经安装了PocketSphinx演示版,它在Ubuntu和Eclipse下工作正常,但是尽管我尝试了,但我无法弄清楚如何添加多个单词的识别.

我想要的只是代码识别单个单词,然后我可以switch()在代码中,例如"向上","向下","向左","向右".我不想识别句子,只想单个单词.

对此有任何帮助将不胜感激.我发现其他用户有类似的问题,但到目前为止还没有人知道答案.


令我困惑的一件事是为什么我们需要使用"唤醒"常数?

private static final String KWS_SEARCH = "wakeup";
private static final String KEYPHRASE = "oh mighty computer";
.
.
.
recognizer.addKeyphraseSearch(KWS_SEARCH, KEYPHRASE);
Run Code Online (Sandbox Code Playgroud)

什么wakeup与任何事情有关?


我已经取得了一些进展(?):使用addGrammarSearch我能够使用一个.gram文件列出我的单词,例如up,down,left,right,forwards,backwards,如果我说的都是那些特定的单词,这似乎很有效.但是,任何其他单词都会导致系统与所述的"最近"单词相称.理想情况下,如果所说的单词不在.gram文件中,我不希望发生识别...

android speech-recognition cmusphinx

17
推荐指数
2
解决办法
2万
查看次数

关键词在言语中的发现

是否有人知道关键字定位系统是免费提供的,并可能提供API?

CMU Sphinx 4和MS Speech API是语音识别引擎,不能用于KWS.

SRI有一个关键字定位系统,但没有下载链接,甚至没有评估.(我甚至找不到任何链接来联系他们的软件)

我在这里找到了一个,但这是一个演示而且有限.

api speech keyword

6
推荐指数
1
解决办法
4133
查看次数