我有很多讲座视频内容,我想要字幕。YouTube 会在特定条件下自动为视频生成字幕(这些条件对我来说仍然有些神秘)。
我希望能够在 YouTube 之外使用这种语音识别技术。我不想上传每个视频只是为了获得成绩单(太耗时),另外,我认为 YouTube 不会为时长超过 30 分钟的视频(大多数是)这样做,此外,我不要认为它会用于非公开列出的视频(这是一个问题,因为它是旨在出售的优质内容)。
完美场景:有一个程序可以从我的桌面上运行以从这些视频中获取转录内容,它的质量与 YouTube 相同或更好,并且具有类似于 SRT 或 YouTube 生成的 XML 的时间码 [如何获取 YouTube 字幕]。
可接受的情况:我可以采取一些技巧来强制 YouTube 转录视频,无论设置为私人还是公开,无论长度如何。
可行方案:有一个库或其他东西可以用来编写我自己的程序。我擅长 C#,也擅长 C++(但我真的更喜欢 C#)。