我从视频文件中提取音频剪辑以进行语音识别。这些视频来自移动/其他手工设备,因此包含大量噪音。我想降低音频的背景噪音,以便我传递给语音识别引擎的语音清晰。我正在使用 ffmpeg 来完成所有这些工作,但我仍停留在降噪阶段。
到目前为止,我已经尝试过以下过滤器:
ffmpeg-20140324-git-63dbba6-win64-static\bin>ffmpeg -i i nput.wav -filter_complex "highpass=f=400,lowpass=f=1800" out2.wav
ffmpeg -i i nput.wav -af "equalizer=f=1000:width_type=h:width=900:g=-10" output.wav
ffmpeg -i i nput.wav -af "bandreject=f=1200:width_type=h:width=900:g=-10" output.wav
Run Code Online (Sandbox Code Playgroud)
但结果非常令人失望。我的理由是,由于语音低于 300-3000 Hz 范围,我可以过滤掉所有其他频率以抑制任何背景噪音。我错过了什么?
此外,我阅读了有关可用于语音增强的韦纳过滤器并发现了这一点,但我不确定如何使用它。
我正在寻找一个独立于扬声器的程序(商业或免费),它使我能够将包含语音录音(尤其是播客)的 MP3 文件转录为文本。我想试试龙语自然,但它似乎只支持转录我自己的演讲录音。那么有哪些替代方案呢?
是否可以从视频文件中分离语音和背景音乐?
我只需要背景音乐。
视频类型:MP4
在 Windows XP 32 位 SP3 上工作
有谁知道一个很好的程序或方法,可以与 Portal 游戏中的 GLaDOS 的声音相匹配?
我要打个 Skype 电话给我男朋友一个惊喜... 哇哈哈
我真的很想知道如何在 Windows 10 上启用 Microsoft Eva(Cortana 的语音)?所以我可以将它用作文本到语音 (TTS) 语音,因为该语音已在 Windows 10 上可用。
我并没有真正使用 IE 进行一般浏览,但我正在尝试在其上测试我的网站。但是,当我现在运行它时,会出现一些随机声音,解释我如何清除缓存和 cookie。这是哪里来的声音?!我的主页是默认的 MSN 主页。我不知道这是什么时候开始发生的,但可能是在周二 MS 更新之后。有没有其他人听说过这个,或者我有什么奇怪的恶意软件?
编辑:
它似乎只有在关闭 javascript 并重新启动 IE 时才会出现。
编辑2:
与互联网断开连接时,语音不会启动。要重现:转到工具...Internet 选项....安全...自定义级别...并在“活动脚本”下禁用它。然后重新启动 IE 并稍等片刻(不要更改/刷新页面)。
我正在寻找粤语的 TTS(文本到语音)引擎。
是否可以降低电话会议中坐在我旁边的人的音量?当我们使用耳机时,这确实很烦人。
作为一名电子和电信工程师,我知道这是不可能的..(实际上当我尝试使用频带通滤波器时..对于我用来使声音未经过滤的每个频率范围(随着音乐逐渐减弱)..
但我只是想知道世界是否知道一些技巧.. ;)
我需要从 mp3 音乐文件中删除人声并希望保留其他乐器声音。我曾尝试使用 YoGen Vocal Remover 3.3.9,但它并没有完全去除声音。
是否可以 ?如果是,那么执行此操作的实际方法是什么?