FFMPEG amix过滤器卷问题与不同持续时间的输入

Sta*_*nyk 5 audio ffmpeg elixir-mix

我注意到ffmpeg amix过滤器在特定情况下输出效果不好.如果输入文件的持续时间相同,它可以正常工 在这种情况下,音量将以恒定值下降,并可以使用",volume=2".

在我的情况下,我正在使用不同持续时间的文件.结果量不好.第一个混合流导致最低量,最后一个流量最高.您可以在图像上看到体积随时间线性增加.

在此输入图像描述

我的命令:

ffmpeg -i temp_0.mp4 -i user_2123_10.mp4  -i user_2123_3.mp4  -i user_2123_4.mp4  
-i user_2123_7.mp4  -i user_2123_5.mp4  -i user_2123_1.mp4  -i user_2123_8.mp4  
-i user_2123_0.mp4  -i user_2123_6.mp4  -i user_2123_9.mp4  -i user_2123_2.mp4  
-i user_2123_11.mp4 -filter_complex "[1:a]adelay=34741.0[aud1];
[2:a]adelay=18241.0[aud2];[3:a]adelay=20602.0[aud3];
[4:a]adelay=27852.0[aud4];[5:a]adelay=22941.0[aud5];
[6:a]adelay=13142.0[aud6];[7:a]adelay=29810.0[aud7];
[8:a]adelay=12.0[aud8];[9:a]adelay=25692.0[aud9];
[10:a]adelay=32143.002[aud10];[11:a]adelay=16101.0[aud11];
[12:a]adelay=40848.0[aud12];
[0:a][aud1][aud2][aud3][aud4][aud5][aud6][aud7]
[aud8][aud9][aud10][aud11]
[aud12]amix=inputs=13:duration=first:dropout_transition=0" 
-vcodec copy -y temp_1.mp4
Run Code Online (Sandbox Code Playgroud)

这可以通过在每个剪辑的开头和结尾应用静音来解决,然后它们将具有相同的持续时间并且音量将处于相同的水平.

请建议我如何使用amix混合多个输入并确保恒定的音量水平.

emi*_*ich 21

最新版本的 FFMPEG 包含normalize滤波器参数amix,您可以使用它来关闭不断变化的标准化。这是它的文档。

您的 amix 过滤器字符串可以更改为:

[aud12]amix=inputs=13:normalize=0
Run Code Online (Sandbox Code Playgroud)


Gya*_*yan 8

amix将每个输入的音量调整为1/nn = no.有效投入.对每个音频帧评估.因此,当输入丢失时,剩余输入的音量将缩小较小的量,因此其音量会增加.

如其他答案所示,更改所有早期输入的dropout_transition是一种方法,但我认为这将导致粗调音量.更好的方法是在amix之后规范化音频.

目前,您有两个选项,loudnormdynaudnorm过滤器.后者要快得多

语法是在amix之后添加它,所以

[aud11][aud12]amix=inputs=13:duration=first:dropout_transition=0,dynaudnorm"
Run Code Online (Sandbox Code Playgroud)

如果您想调整最大音量或RMS模式标准化的参数,请阅读文档.等等


klo*_*oma 8

我找到的解决方案是以“下降”顺序指定每个轨道的音量,然后不使用标准化过滤器。

我使用这个示例,在不同的位置连接相同的音频文件:

ffmpeg -vn -i test.mp3 -i test.mp3 -i test.mp3 -filter_complex "[0]adelay=0|0,volume=3[a];[1]adelay=2000|2000,volume=2[b];[2]adelay=4000|4000,volume=1[c];[a][b][c]amix=inputs=3:dropout_transition=0" -q:a 1 -acodec libmp3lame -y amix-volume.mp3
Run Code Online (Sandbox Code Playgroud)

更多详细信息,请参阅此图片。第一个轨道是正常混音,第二个轨道是指定音量的轨道;第三个是原始曲目。正如我们所看到的,第二首​​曲目看起来有正常的音量。

在此输入图像描述

ffmpeg -vn -i test.mp3 -i test.mp3 -i test.mp3 -filter_complex "[0]adelay=0|0[a];[1]adelay=2000|2000[b];[2]adelay=4000|4000[c];[a][b][c]amix=inputs=3:dropout_transition=0" -q:a 1 -acodec libmp3lame -y amix-no-volume.mp3

ffmpeg -vn -i test.mp3 -i test.mp3 -i test.mp3 -filter_complex "[0]adelay=0|0,volume=3[a];[1]adelay=2000|2000,volume=2[b];[2]adelay=4000|4000,volume=1[c];[a][b][c]amix=inputs=3:dropout_transition=0" -q:a 1 -acodec libmp3lame -y amix-volume.mp3
Run Code Online (Sandbox Code Playgroud)

我不太明白为什么 amix 改变音量;反正; 一段时间以来我一直在寻找一个好的解决方案。


kub*_*ubi 5

正如Maxim所说,解决方案似乎是“前置放大器”或乘法的组合,并且您必须设置dropout_transition >= max delay + max input length(或非常高的数字):

amix=inputs=13:dropout_transition=1000,volume=13
Run Code Online (Sandbox Code Playgroud)

笔记:

  • amix无论如何都必须重新采样浮点数,因此添加volume过滤器没有缺点(默认情况下,它也重新采样为浮点数)。
    并且由于我们使用浮点数,因此没有裁剪并且(几乎)没有精度损失。
  • H't to @Mulvya 进行分析,但他们的解决方案令人沮丧地非数学
  • 我最初试图用sox来做到这一点,这太慢了。Sox 的remix过滤器具有-m禁用1/n调整的开关。
  • 虽然速度更快,但 ffmpeg 似乎为相同的任务使用了更多的内存。情况因人而异-我没有彻底测试这一点,因为我终于上它采用了小python脚本解决pyduboverlay功能,并且只在内存中保持最终输出文件和一个段(而ffmpeg的和SOx似乎让所有的段在记忆中)。