如何将WebRTC录制的音频流传递到Google Speech api进行实时转录？

Question

我想做的是使用 webRTC 对浏览器中录制的视频进行实时转录。用例基本上是实时字幕，就像谷歌环聊一样。

所以我有一个WebRTC程序在浏览器中运行。它将 webm 对象发送回服务器。它们是线性32 音频编码。Google 语音转文本仅接受 Linear16 或 Flac 文件。

有没有办法将线性32实时转换为线性16？

否则，是否有人能够将 webRTC 与 Google 语音连接起来以实现实时转录？

任何关于在哪里寻找解决这个问题的建议都会很棒

Answer 1

查看此存储库，它可能会对您有所帮助 - https://github.com/muaz-khan/Translator

Translator.js 是一个基于 Google 语音识别和翻译 API 构建的 JavaScript 库，用于转录和翻译语音和文本。它支持许多语言环境并为 WebRTC 带来全球化！