将 16 位灰度 PNG 转换为 HEVC/x265

Ben*_*zos 3 ffmpeg 16-bit hevc libx265 video-compression

我想将 12 位图像信号转换为 HEVC 以进行有效压缩。因为我需要能够重建原始 12 位信号,所以压缩需要是无损可逆的。目前我的数据为 16 位 PNG 文件。

我的第一次尝试是使用 ffmpeg:

ffmpeg -y -framerate 1 -i input.png -c:v libx265 -x265-params "lossless=1" output.mp4
Run Code Online (Sandbox Code Playgroud)

不幸的是,输出是不可逆的。从mp4中提取图像时,像素值略有偏差。

ffmpeg -i output.mp4 -vframes 1 reconstructed.png
Run Code Online (Sandbox Code Playgroud)

以下答案建议首先将输入转换为 YUV444 以避免 ffmpeg 出现意外行为:无损 x264 压缩

到目前为止,我未能成功将 16 位文件转换为 YUV、将其转换为 x256 并在解码时收到正确的重建。

有没有直接的方法将 16 位图像转换为 HEVC?

Rot*_*tem 5

我找到了一个具有较小舍入误差的解决方案:

编码:

  • 基于以下帖子:How to render png's as h.265 12 bit video?
    使用时可以使用以下编解码器参数:-x265-params lossless=1 -pix_fmt yuv444p12le用于有损 12 bpc 编码。

  • 通过反复试验,我意识到 12 位数据必须位于每个 16 位元素的高 12 位中。您需要将输入像素放大 16 倍才能将数据放入高位。
    (缩放 16 相当于将 uint16 元素左移 4)。
    要放大像素,您可以使用colorlevels视频滤镜:
    -vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625

以下命令对单个帧进行编码:

 ffmpeg -i input.png -vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625 -c:v libx265 -x265-params lossless=1 -pix_fmt yuv444p12le output.mkv
Run Code Online (Sandbox Code Playgroud)

解码:

  • 为了进行解码,您需要将像素除以 16,以便将数据放入较低的 12 位中。
    (除以 16 相当于将 uint16 元素右移 4)。
    我找不到使用的解决方案colorlevels,所以我使用了curves过滤器:
    -vf "curves=r='0/0 1.0/0.0625':g='0/0 1.0/0.0625':b='0/0 1.0/0.0625'"
  • 16 位 PNG 的合适像素格式是rgb48be.

以下命令解码单个帧(并除以 16):

ffmpeg -i output.mkv -vf "curves=r='0/0 1.0/0.0625':g='0/0 1.0/0.0625':b='0/0 1.0/0.0625'" -pix_fmt rgb48be reconstructed.png
Run Code Online (Sandbox Code Playgroud)

差异:
之间的最大绝对差异是水平。 造成差异的原因可能是 RGB 与 YUV 相互转换造成的舍入误差。input.pngreconstructed.png4


我使用以下 MATLAB 代码进行测试:

 ffmpeg -i input.png -vf colorlevels=rimax=0.0625:gimax=0.0625:bimax=0.0625 -c:v libx265 -x265-params lossless=1 -pix_fmt yuv444p12le output.mkv
Run Code Online (Sandbox Code Playgroud)

更新:

使用灰度格式:
使用灰度格式时,不需要将像素格式转换为 YUV。
从灰度转换为 YUV444 会将输入数据的大小乘以 3,因此最好避免转换。

以下命令对单个灰度帧进行编码:

 ffmpeg -i input.png -vf "curves=all='0/0 0.0625/1.0'" -c:v libx265 -x265-params lossless=1 -pix_fmt gray12le -bsf:v hevc_metadata=video_full_range_flag=1 output.mkv
Run Code Online (Sandbox Code Playgroud)

以下命令解码单个灰度帧(并除以 16):

ffmpeg -i output.mkv -vf "curves=all='0/0 1.0/0.0625'" -pix_fmt gray16be reconstructed.png
Run Code Online (Sandbox Code Playgroud)

最大绝对差为 2。


使用注意事项-bsf:v hevc_metadata=video_full_range_flag=1

在H.265中,Y颜色通道的默认范围是“有限范围”。
对于 8 位,“有限范围”适用 [16, 235]。
对于 12 位,“有限范围”适用 [256, 3760]。
当8位使用“全范围”[0, 255]或12位使用[0, 4095]时,您需要在流的元数据中指定它。
使用 FFmpeg 设置元数据的方法是使用比特流过滤器