我想做的是使用 webRTC 对浏览器中录制的视频进行实时转录。用例基本上是实时字幕,就像谷歌环聊一样。
所以我有一个WebRTC程序在浏览器中运行。它将 webm 对象发送回服务器。它们是线性32 音频编码。Google 语音转文本仅接受 Linear16 或 Flac 文件。
有没有办法将线性32实时转换为线性16?
否则,是否有人能够将 webRTC 与 Google 语音连接起来以实现实时转录?
任何关于在哪里寻找解决这个问题的建议都会很棒
matroska webrtc google-speech-api
google-speech-api ×1
matroska ×1
webrtc ×1