声音识别API,SDK(Android)

KKO*_*KKO 12 audio android audio-processing

我需要制作一个Android应用程序,可以识别我创建的某些声音文件,并在识别时执行操作.所以类似于Shazam/Soundhound,但有我自己的声音文件.是否有任何API或SDK或其他东西?我读过关于Echoprint的内容,但我知道它适用于Windows和iOS,对我来说似乎很难.那会有用吗?或者还有其他选择吗?

PS:为了说清楚,我不想要语音识别或文本到语音.我的声音文件可以有音乐,失真的声音,效果等

KKO*_*KKO 1

一年后,我最终使用了为 Android 编译的 Echoprint,如此处所述。它得到了一些结果,但总的来说它的效果很差,特别是对于自定义声音文件。Echoprint 不适用于 OTA 识别。我会推荐它用于测试/原型设计,但不适合生产。不幸的是,到目前为止,它是唯一一个允许您拥有自己的服务器和声音文件的软件。