我有一个基于React的应用程序的情况,我有一个输入,我也希望允许语音输入.我可以将它与Chrome和Firefox兼容,所以我想使用getUserMedia.我知道我将使用Google Cloud的Speech to Text API.不过,我有几点需要注意:
- 我想这是我的流音频数据的活,不只是当我做记录.这意味着我发现的很多解决方案都不会很好用,因为它不足以保存文件然后将其发送到Google Cloud Speech.
- 我不相信我的前端有我的Google Cloud API信息.相反,我已经在后端运行了一个具有我的凭据的服务,我想将音频(实时)流式传输到后端,然后从后端流传输到Google Cloud,然后将更新发送到我的成绩单他们回到了前端.
- 我已经使用socket.io连接到该后端服务,我想通过套接字完全管理它,而不必使用Binary.js或类似的东西.
似乎没有一个关于如何做到这一点的好教程.我该怎么办?