如何将WebRTC录制的音频流传递到Google Speech api进行实时转录?

Mat*_*Ffc 5 matroska webrtc google-speech-api

我想做的是使用 webRTC 对浏览器中录制的视频进行实时转录。用例基本上是实时字幕,就像谷歌环聊一样。

所以我有一个WebRTC程序在浏览器中运行。它将 webm 对象发送回服务器。它们是线性32 音频编码。Google 语音转文本仅接受 Linear16 或 Flac 文件。

有没有办法将线性32实时转换为线性16?

否则,是否有人能够将 webRTC 与 Google 语音连接起来以实现实时转录?

任何关于在哪里寻找解决这个问题的建议都会很棒

小智 2

查看此存储库,它可能会对您有所帮助 - https://github.com/muaz-khan/Translator

Translator.js 是一个基于 Google 语音识别和翻译 API 构建的 JavaScript 库,用于转录和翻译语音和文本。它支持许多语言环境并为 WebRTC 带来全球化!