是否可以通过编程方式使用 Chrome 实时字幕?

JW.*_*JW. 6 google-chrome voice-recognition

Chrome 89 具有实时字幕功能,可以在播放音频/视频时转录英文文本。它甚至可以离线工作,因此它不会联系谷歌的服务器。

有没有办法以编程方式使用此功能,例如为其提供音频文件并捕获转录文本?

编辑: 这个人写了一些代码可以让你做到这一点。但你需要自己弄清楚如何反汇编和修补 Google 的 libsoda。不过我确实让它工作了。

Man*_*lMB 1

我尝试在 Chrome 上运行 puppeteer 并每 250 毫秒进行一次屏幕截图,但无法通过转到“设置”、\xe2\x80\x9cAdvanced\xe2\x80\x9d 部分和 \xe2 来启用实时字幕。 \x80\x9c辅助功能。\xe2\x80\x9d

\n

至少我想让图像使用 OCR 服务来获取文本。

\n

使用 Puppeteer 的 Chrome 辅助功能

\n