我有一个PHP Web应用程序,我正在寻找一个开源,高精度的语音到文本识别实现,它将采用语音命令打开用户的网页.示例:" Make Sales "(这将打开Create Sales PHP页面)," Make Purchase order "," Open END-OF-DAY reports "等.
我的问题:
我想知道我们是否可以使用Mozilla DeepSpeech从Firefox浏览器中获取.wav音频并将语音返回文本.如果是的话,使用话筒从Firefox录制语音的流量是什么?使用DeepSpeech引擎转换文本?
如何制作类似于OK-GOOGLE的唤醒/启动呼叫,它将准备好侦听命令?
php speech-recognition speech-to-text webspeech-api mozilla-deepspeech