如何从视频文件中分离语音和背景音乐

Spo*_*nts 15 video music voice

是否可以从视频文件中分离语音和背景音乐?

我只需要背景音乐。

视频类型:MP4

在 Windows XP 32 位 SP3 上工作

slh*_*hck 18

斯普利特

Spleeter是一个 Python 库,可以从联合音频源中提取音乐和人声。它基于机器学习,可以提供不同的输出类型(提取的词干数量)。

它提供以下输出:

  • 人声(歌声)/伴奏分离(2个词干)
  • 人声/鼓/贝司/其他分离(4个词干)
  • 人声/鼓/贝斯/钢琴/其他分离(5茎)

大胆

Audacity——一个免费和开源的跨平台音频编辑器——可以做到这一点,使用人声减少和隔离效果。您应该首先从视频文件中提取音频,例如使用ffmpeg

ffmpeg -i video.mp4 -c:a pcm_s16le audio.wav
Run Code Online (Sandbox Code Playgroud)

然后将audio.wav文件加载到 Audacity 中:

如果您只想获取背景音乐,请选择“删除人声”选项;如果你想要相反的,请选择Isolate Vocals

请注意,这听起来永远不会完美。人声隔离是一项艰巨的任务,因为您听到的所有声音基本上都混合成两个音轨。在隔离不同的声源方面,算法永远不会像您的大脑一样好。你的音频源应该是一个立体声文件,人声被移到死点。它还可能会产生误报,从而在此过程中删除其他工具。

  • 这是我读过的有关 Audacity 的最佳教程之一。被低估的答案。非常感谢 :) (2认同)

afr*_*ier 6

除非它们在您的视频中是单独的音轨,否则不容易。您可能需要做的是将视频中的音轨提取到一个单独的文件中,使用专用工具编辑音频文件,然后将结果重新混合到视频中。

demux/remux 部分很简单。困难的是尝试隔离背景音乐。您可能需要尝试不同的效果,所有这些很可能会导致音频保真度的显着损失或无法完全删除对话,如果不是两者兼而有之的话。更重要的是,您要将该输出重新编码为一个新的 mp3/aac 文件,并且在重新编码和音频处理之间,您的输出听起来会比原来的差很多。

通过尝试重新掌握背景音乐并完全替换电影文件中的音轨,您可能会获得更好的结果。