我有很多讲座视频内容,我想要字幕。YouTube 会在特定条件下自动为视频生成字幕(这些条件对我来说仍然有些神秘)。
我希望能够在 YouTube 之外使用这种语音识别技术。我不想上传每个视频只是为了获得成绩单(太耗时),另外,我认为 YouTube 不会为时长超过 30 分钟的视频(大多数是)这样做,此外,我不要认为它会用于非公开列出的视频(这是一个问题,因为它是旨在出售的优质内容)。
完美场景:有一个程序可以从我的桌面上运行以从这些视频中获取转录内容,它的质量与 YouTube 相同或更好,并且具有类似于 SRT 或 YouTube 生成的 XML 的时间码 [如何获取 YouTube 字幕]。
可接受的情况:我可以采取一些技巧来强制 YouTube 转录视频,无论设置为私人还是公开,无论长度如何。
可行方案:有一个库或其他东西可以用来编写我自己的程序。我擅长 C#,也擅长 C++(但我真的更喜欢 C#)。
我正在寻找一个独立于扬声器的程序(商业或免费),它使我能够将包含语音录音(尤其是播客)的 MP3 文件转录为文本。我想试试龙语自然,但它似乎只支持转录我自己的演讲录音。那么有哪些替代方案呢?
我正在寻找一种软件,它可以让我输入音频文件(.wav .mp3...)并输出音频文件的文本。
有这样的软件吗?我只找到了将(实时)语音转换为文本的软件,但没有找到将音频文件转换为文本的软件。
mac 上最好的语音转文字软件是什么?我有一个小时的音频需要转录,我真的不想手动完成:-)。
我更喜欢免费选项,我喜欢开源,所以如果有我想知道的项目。不过,欢迎所有答案。
使用 Chrome 作为网络浏览器时,有什么方法可以在 gmail 中启用语音到文本(语音识别)?我真的很喜欢通过语音在 google.com 上搜索的功能,而且我也喜欢说我的邮件而不是打字。我尝试了几个 chrome 扩展,例如https://chrome.google.com/webstore/detail/speech-recognition-for-gm/ffnepgjlfiinpkplhjmehkdhnaaongdk?hl=d 但没有一个工作。我不知道为什么,因为该功能是相同的,因为语音识别 API 显然已经存在;所以它应该很容易让它也可以在gmail中使用!?至少从谷歌的角度来看......有什么想法吗?
gmail google-chrome speech-to-text speech-recognition google-chrome-extensions
使用 Android 时,使用 Swiftkey 键盘,我可以在任何地方使用 Google Speech to Text,只需快速按住一个键即可。在我的 Windows PC 中,我想用麦克风说话并让 Google 为我打字。我知道我可以使用 Chrome 在某些 Google 页面(如“语言工具”)中使用它,然后复制并粘贴到目标应用程序中。有没有自动的方法来做到这一点?
我见过人们对着他们的电脑说话的例子,它会写下他们所说的一切。如何使用 MS Office 2007 执行此操作?有没有其他程序也可以做到这一点?
我想在 Windows 11 中的两种语言之间切换语音识别(语音到文本以在文本框中使用)。到目前为止我尝试过:
在时间&语言/语言&地区设置中切换语言优先级ms-settings:regionlanguage(我安装了2种语言)
在时间和语言/语音设置中切换语音语言ms-settings:speech
在控制面板中更改语音识别设置control /name Microsoft.SpeechRecognition
到目前为止,似乎没有任何效果,它试图选择相同的语言(在我的例子中是英语)。使用在其他语言(德语)中听起来相似的测试短语this is a test,无论我使用哪种语言,我都会得到英语输出。对于其他发音相似的单词也是如此。有任何想法吗?