使用 Python FFMPEG 在模板/布局中合并多个视频?

J. *_*old 8 python video layout ffmpeg python-3.x

我目前正在尝试使用FFMPEGPython 库编辑视频。我正在使用多种文件格式,精确地.mp4.png和文本输入 ( .txt)。目标是在“布局”中嵌入不同的视频文件 - 为了演示目的,我试图设计一个示例图片

例子

输出应该是.mp4具有以下元素的 1920x1080文件:

  • 元素3是视频本身(因为是手机录屏,大概显示的大小)
  • 元素 12是“寄宿生”,即静态图片(?)
  • 元素 4代表一个有规律变化的文本——通过 python 脚本输入(可能是从.txt文件中读取的)
  • 元素 5描绘了一个.png.svg或类似的;一般是广义上的“图片”。

我正在努力实现是创建一种模板文件,其中我“只是”需要输入不同的.mp4.png文件,以及文本,并在最后我会收到一个.mp4文件,而我的Python脚本功能导航器将数据包发送到 FFMPEG 以处理视频本身。

我深入研究了 FFMPEG 库以及特定于 python 的存储库,但找不到这样的选项。有很多文章解释了“频道布局”的用法(尽管这些似乎不适合我的需要)。

如果有人想尝试相同的版本:

  • python --versionPython 3.7.3
  • pip show ffmpeg版本:1.4它是最新的;关于题外话:使用 FFMPEG 不是强制性的,我更喜欢使用这个库,但如果它不提供我正在寻找的功能,我会高度如果有人提出其他建议,不胜感激

llo*_*gan 5

在此处输入图片说明

ffmpeg -i left.jpg -i video.mp4 -i right.png -i logo.png -filter_complex "[0]scale=(1920-1080*($width/$height))/2:1080:force_original_aspect_ratio=increase,crop=(1920-1080*($width/$height))/2:1080[left];[1]scale=-2:1080[main];[2]scale=(1920-1080*($width/$height))/2:1080:force_original_aspect_ratio=increase,crop=(1920-1080*($width/$height))/2:1080[right];[left][main][right]hstack=inputs=3[bg];[bg][3]overlay=5:main_h-overlay_h-5:format=auto,drawtext=textfile=text.txt:reload=1:x=w-tw-10:y=h-th-10,format=yuv420p" -movflags +faststart output.mp4
Run Code Online (Sandbox Code Playgroud)

它所做的是缩放,video.mp4因此它是 1080 像素高并自动缩放宽度。left.jpg并按right.png比例缩放以占用余数,因此结果为 1920x1080。

这是一个简单的示例,不适用于所有输入,例如video.mp4自动缩放宽度大于 1920,但您可以使用算术表达式来处理。

$width$height参考 的大小video.mp4。有关使用 JSON 或 XML 的 Python 友好方法,请参阅从 ffmpeg 获取视频尺寸/分辨率/宽度 x 高度

为见文档的规模产量hstackDrawText的覆盖格式过滤器。

一个更简单的方法是只添加彩色条而不是任意图像。请参阅使用 ffmpeg 调整视频大小以适应特定大小

通过原子更新动态更改文本text.txt。或者,如果您希望文本在某些时间戳上更改(您没有指定您需要的内容),则使用字幕过滤器而不是 drawtext。

相关回答:


Pro*_*mer 3

我已经做到了。该代码可以用作命令行程序或模块。要了解有关命令行用法的更多信息,请使用 --help 选项调用它。对于模块使用,请make_video在代码中导入函数(或复制粘贴它),并将适当的参数传递给它。我提供了我的脚本使用一些示例材料生成的屏幕截图,当然还有代码。代码:

#!/usr/bin/python3
#-*-coding: utf-8-*-

import sys, argparse, ffmpeg, os

def make_video(video, left_boarder, right_boarder, picture_file, picture_pos, text_file, text_pos, output):
    videoprobe = ffmpeg.probe(video)
    videowidth, videoheight = videoprobe["streams"][0]["width"], videoprobe["streams"][0]["height"] # get width of main video
    scale = (1080 / videoheight)
    videowidth *= scale
    videoheight *= scale
    videostr = ffmpeg.input(video) # open main video
    audiostr = videostr.audio
    videostr = ffmpeg.filter(videostr, "scale", "%dx%d" %(videowidth, videoheight))
    videostr = ffmpeg.filter(videostr, "pad", 1920, 1080, "(ow-iw)/2", "(oh-ih)/2")
    videostr = videostr.split()
    boarderwidth = (1920 - videowidth) / 2 # calculate width of boarders
    left_boarderstr = ffmpeg.input(left_boarder) # open left boarder and scale it
    left_boarderstr = ffmpeg.filter(left_boarderstr, "scale", "%dx%d" % (boarderwidth, 1080))
    right_boarderstr = ffmpeg.input(right_boarder) # open right boarder
    right_boarderstr = ffmpeg.filter(right_boarderstr, "scale", "%dx%d" % (boarderwidth, 1080))
    picturewidth = boarderwidth - 100 # calculate width of picture
    pictureheight = (1080 / 3) - 100 # calculate height of picture
    picturestr = ffmpeg.input(picture_file) # open picture and scale it (there will be a padding of 100 px around it)
    picturestr = ffmpeg.filter(picturestr, "scale", "%dx%d" % (picturewidth, pictureheight))
    videostr = ffmpeg.overlay(videostr[0], left_boarderstr, x=0, y=0) # add left boarder
    videostr = ffmpeg.overlay(videostr, right_boarderstr, x=boarderwidth + videowidth, y=0) #add right boarder
    picture_y = (((1080 / 3) * 2) + 50) # calculate picture y position for bottom alignment
    if picture_pos == "top":
        picture_y = 50
    elif picture_pos == "center":
        picture_y = (1080 / 3) + 50
    videostr = ffmpeg.overlay(videostr, picturestr, x=50, y=picture_y)
    text_x = (1920 - boarderwidth) + 50
    text_y = ((1080 / 3) * 2) + 50
    if text_pos == "center":
        text_y = (1080 / 3) + 50
    elif text_pos == "top":
        text_y = 50
    videostr = ffmpeg.drawtext(videostr, textfile=text_file, reload=1, x=text_x, y=text_y, fontsize=50)
    videostr = ffmpeg.output(videostr, audiostr, output)
    ffmpeg.run(videostr)

def main():
    #create ArgumentParser and add options to it
    argp = argparse.ArgumentParser(prog="ffmpeg-template")
    argp.add_argument("--videos", help="paths to main videos (default: video.mp4)", nargs="*", default="video.mp4")
    argp.add_argument("--left-boarders", help="paths to images for left boarders (default: left_boarder.png)", nargs="*", default="left_boarder.png")
    argp.add_argument("--right-boarders", help="paths to images for right boarders (default: right_boarder.png)", nargs="*", default="right_boarder.png")
    argp.add_argument("--picture-files", nargs="*", help="paths to pictures (default: picture.png)",  default="picture.png")
    argp.add_argument("--picture-pos", help="where to put the pictures (default: bottom)", choices=["top", "center", "bottom"], default="bottom")
    argp.add_argument("--text-files", nargs="*", help="paths to files with text (default: text.txt)", default="text.txt")
    argp.add_argument("--text-pos", help="where to put the texts (default: bottom)", choices=["top", "center", "bottom"], default="bottom")
    argp.add_argument("--outputs", nargs="*", help="paths to outputfiles (default: out.mp4)", default="out.mp4")
    args = argp.parse_args()
    # if only one file was provided, put it into a list (else, later, every letter of the filename will be treated as a filename)
    if type(args.videos) == str:
        args.videos = [args.videos]
    if type(args.left_boarders) == str:
        args.left_boarders = [args.left_boarders]
    if type(args.right_boarders) == str:
        args.right_boarders = [args.right_boarders]
    if type(args.picture_files) == str:
        args.picture_files = [args.picture_files]
    if type(args.text_files) == str:
        args.text_files = [args.text_files]
    if type(args.outputs) == str:
        args.outputs = [args.outputs]

    for i in (range(0, min(len(args.videos), len(args.left_boarders), len(args.right_boarders), len(args.picture_files), len(args.text_files), len(args.outputs))) or [0]):
        print("Info : merging video %s, boarders %s %s, picture %s and textfile %s into %s" % (args.videos[i], args.left_boarders[i], args.right_boarders[i], args.picture_files[i], args.text_files[i], args.outputs[i]))
        # check if all files provided with the options exist
        if not os.path.isfile(args.videos[i]):
            print("Error : video %s was not found" % args.videos[i])
            continue
        if not os.path.isfile(args.left_boarders[i]):
            print("Error : left boarder %s was not found" % args.left_boarders[i])
            continue
        if not os.path.isfile(args.right_boarders[i]):
            print("Error : rightt boarder %s was not found" % args.right_boarders[i])
            continue
        if not os.path.isfile(args.picture_files[i]):
            print("Error : picture %s was not found" % args.picture_files[i])
            continue
        if not os.path.isfile(args.text_files[i]):
            print("Error : textfile %s was not found" % args.text_files[i])
            continue
        try:
            make_video(args.videos[i], args.left_boarders[i], args.right_boarders[i], args.picture_files[i], args.picture_pos, args.text_files[i], args.text_pos, args.outputs[i])
        except Exception as e:
            print(e)

if __name__ == "__main__":
    main()
Run Code Online (Sandbox Code Playgroud)

直接用作脚本的示例:

$ ./ffmpeg-template --videos input1.mp4 inout2.mp4 --left-boarders left_boarder1.png left_boarder2.png --right-boarders right_boarder1.png right_boarder2.png --picture-files picture1.png picture2.png --text-files text1.txt text2.png --outputs out1.mp4 out2.mp4 --picture-pos bottom --text-pos bottom
Run Code Online (Sandbox Code Playgroud)

作为选项的值,我采用了默认值。如果省略这些选项,将使用这些默认值,并且如果未找到其中一个文件,将显示一条错误消息。

图像:在此输入图像描述