使用 ffmpeg 和 xfade 过滤器合并多个视频文件

tjk*_*tjk 3 video ffmpeg concatenation cross-fade

我需要将多个视频文件(包含音频)合并到一个视频中。我注意到最近发布并使用了 xfade,但我遇到了音频同步问题。

所有视频的视频和音频都采用相同的格式/分辨率/声望和比特率/等。

这是我使用 0.5 交叉淡入淡出过渡合并 5 个不同持续时间的视频的方法:

ffmpeg \
-i v0.mp4 \
-i v1.mp4 \
-i v2.mp4 \
-i v3.mp4 \
-i v4.mp4 \
-filter_complex \
"[0][1]xfade=transition=fade:duration=0.5:offset=3.5[V01]; \
 [V01][2]xfade=transition=fade:duration=0.5:offset=32.75[V02]; \
 [V02][3]xfade=transition=fade:duration=0.5:offset=67.75[V03]; \
 [V03][4]xfade=transition=fade:duration=0.5:offset=98.75[video]; \
 [0:a][1:a]acrossfade=d=0.5:c1=tri:c2=tri[A01]; \
 [A01][2:a]acrossfade=d=0.5:c1=tri:c2=tri[A02]; \
 [A02][3:a]acrossfade=d=0.5:c1=tri:c2=tri[A03]; \
 [A03][4:a]acrossfade=d=0.5:c1=tri:c2=tri[audio]" \
-vsync 0 -map "[video]" -map "[audio]" out.mp4
Run Code Online (Sandbox Code Playgroud)

上面的代码生成一个带音频的视频。第一段和第二段与音频对齐,但从第二个过渡开始,声音未对齐。

llo*_*gan 10

您的偏移量不正确。尝试:

ffmpeg -i v0.mp4 -i v1.mp4 -i v2.mp4 -i v3.mp4 -i v4.mp4 -filter_complex \
"[0][1:v]xfade=transition=fade:duration=1:offset=3[vfade1]; \
 [vfade1][2:v]xfade=transition=fade:duration=1:offset=10[vfade2]; \
 [vfade2][3:v]xfade=transition=fade:duration=1:offset=21[vfade3]; \
 [vfade3][4:v]xfade=transition=fade:duration=1:offset=25,format=yuv420p; \
 [0:a][1:a]acrossfade=d=1[afade1]; \
 [afade1][2:a]acrossfade=d=1[afade2]; \
 [afade2][3:a]acrossfade=d=1[afade3]; \
 [afade3][4:a]acrossfade=d=1" \
-movflags +faststart out.mp4
Run Code Online (Sandbox Code Playgroud)

如何获得 xfadeoffset值:

输入 输入持续时间 + 以前的xfade offset —— 淡入淡出 duration offset =
v0.mp4 4 + 0 —— 1 3
v1.mp4 8 + 3 —— 1 10
v2.mp4 12 + 10 —— 1 21
v3.mp4 5 + 21 —— 1 25

这些是与原始问题中显示的持续时间不同的简化示例持续时间。


Roy*_*rot 5

自动化该过程将有助于处理计算偏移量时的错误。我创建了一个 Python 脚本来进行计算并为任何大小的输入视频列表构建一个图表:

https://gist.github.com/royshil/369e175960718b5a03e40f279b131788

它将检查视频文件的长度(带有ffprobe)以找出正确的偏移量。

问题的关键是构建过滤器图并计算偏移量:

# Prepare the filter graph
video_fades = ""
audio_fades = ""
last_fade_output = "0:v"
last_audio_output = "0:a"
video_length = 0
for i in range(len(segments) - 1):
    # Video graph: chain the xfade operator together
    video_length += file_lengths[i]
    next_fade_output = "v%d%d" % (i, i + 1)
    video_fades += "[%s][%d:v]xfade=duration=0.5:offset=%.3f[%s]; " % \
        (last_fade_output, i + 1, video_length - 1, next_fade_output)
    last_fade_output = next_fade_output

    # Audio graph:
    next_audio_output = "a%d%d" % (i, i + 1)
    audio_fades += "[%s][%d:a]acrossfade=d=1[%s]%s " % \
        (last_audio_output, i + 1, next_audio_output, ";" if (i+1) < len(segments)-1 else "")
    last_audio_output = next_audio_output
Run Code Online (Sandbox Code Playgroud)

它可能会产生一个过滤器图,例如

[0:v][1:v]xfade=duration=0.5:offset=42.511[v01]; 
[v01][2:v]xfade=duration=0.5:offset=908.517[v12]; 
[v12][3:v]xfade=duration=0.5:offset=1098.523[v23]; 
[v23][4:v]xfade=duration=0.5:offset=1234.523[v34]; 
[v34][5:v]xfade=duration=0.5:offset=2375.523[v45]; 
[v45][6:v]xfade=duration=0.5:offset=2472.526[v56]; 
[v56][7:v]xfade=duration=0.5:offset=2659.693[v67]; 
[0:a][1:a]acrossfade=d=1[a01]; 
[a01][2:a]acrossfade=d=1[a12]; 
[a12][3:a]acrossfade=d=1[a23]; 
[a23][4:a]acrossfade=d=1[a34]; 
[a34][5:a]acrossfade=d=1[a45]; 
[a45][6:a]acrossfade=d=1[a56]; 
[a56][7:a]acrossfade=d=1[a67]
Run Code Online (Sandbox Code Playgroud)