Linux上无损avi编码

dla*_*nts 6 opencv ffmpeg codec gstreamer fourcc

我正在尝试使用opencv编写视频.对我来说这很重要 - 因此它必须是一个无损编解码器.我在Ubuntu 12.04上使用OpenCV 2.4.1

以前,我使用的是fourcc代码0.这给了我想要的确切结果,并且我能够完美地恢复图像.

我不确定发生了什么,但截至最近的更新(2012年7月20日左右),出现了问题,我无法再使用这个4cc代码编写文件了.我真的不记得它是什么,但它可能来自更新,从我的软件中心删除一些软件,以及我在一般清洁期间做的一些其他事情......

当我使用mediainfo(http://www.fourcc.org/identifier/)检查旧文件时,我看到以下结果:

Complete name                            : oldsample.avi
Format                                   : AVI
Format/Info                              : Audio Video Interleave
Format profile                           : OpenDML
File size                                : 1.07 GiB
Duration                                 : 41s 467ms
Overall bit rate                         : 221 Mbps
Writing application                      : Lavf53.5.0
Video
ID                                       : 0
Format                                   : RGB
Codec ID                                 : 0x00000000
Codec ID/Info                            : Basic Windows bitmap format. 1, 4 and 8 bpp     versions are palettised. 16, 24 and 32bpp contain raw RGB samples
Duration                                 : 41s 467ms
Bit rate                                 : 221 Mbps
Width                                    : 640 pixels
Height                                   : 4294966 816 pixels
Display aspect ratio                     : 0.000
Frame rate                               : 30.000 fps
Bit depth                                : 8 bits
Stream size                              : 1.07 GiB (100%)
Run Code Online (Sandbox Code Playgroud)

现在,我看到当我使用0 fourcc编解码器编写时,程序实际默认为i420编解码器.这是我现在尝试写的一个文件的输出:

Complete name                            : newsample.avi
Format                                   : AVI
Format/Info                              : Audio Video Interleave
File size                                : 73.0 MiB
Duration                                 : 5s 533ms
Overall bit rate                         : 111 Mbps
Writing application                      : Lavf54.6.100
Video
ID                                       : 0
Format                                   : YUV
Codec ID                                 : I420
Codec ID/Info                            : 8 bit Y plane followed by 8 bit 2x2 subsampled U and V planes.
Duration                                 : 5s 533ms
Bit rate                                 : 111 Mbps
Width                                    : 640 pixels
Height                                   : 480 pixels
Display aspect ratio                     : 4:3
Frame rate                               : 30.000 fps
Compression mode                         : Lossless
Bits/(Pixel*Frame)                       : 12.000
Stream size                              : 72.9 MiB (100%)
Run Code Online (Sandbox Code Playgroud)

这种格式,以及我尝试使用的其他格式(如huffyuv HFYU),对我来说不起作用,因为我最终得到像这样的效果http://imgur.com/a/0OC4y - 你看到明亮的文物进来了我假设是在HFYU的情况下有损压缩或色度子采样,它应该是无损的.您正在查看的是我的某个视频中的红色频道.当您同时查看所有3个通道时,感知效果可以忽略不计,但我必须精确地重建图像.

此外,虽然我能够在像vlc这样的媒体播放器中播放我的旧文件,但我突然发现它们与opencv完全不兼容.当我尝试使用视频捕捉打开旧文件时,打开步骤工作正常,但尝试执行读取操作会导致段错误.此外,当我尝试用以下任何一个写:

CV_FOURCC(0,0,0,0)
0
Run Code Online (Sandbox Code Playgroud)

出于某种原因,Opencv默认为I420.

接下来,我尝试使用一些备用编解码器."DIB"似乎应该对我有用,在opencv网站(http://opencv.willowgarage.com/wiki/VideoCodecs)上,它被列为"推荐"编解码器.但是,尝试使用此会导致以下消息:

OpenCV-2.4.1/modules/highgui/src/cap_gstreamer.cpp:483: error: (-210) Gstreamer Opencv backend doesn't support this codec acutally. in function CvVideoWriter_GStreamer::open

Aborted (core dumped)
Run Code Online (Sandbox Code Playgroud)

我检查了这个编解码器的opencv源代码,并偶然发现了以下内容:

cd OpenCV-2.4.1/modules
grep -i -r "CV_FOURCC" ./*
...
./highgui/src/cap_qt.cpp:    /*if( fourcc == CV_FOURCC( 'D', 'I', 'B', ' ' ))
./highgui/include/opencv2/highgui/highgui_c.h:#define CV_FOURCC_DEFAULT CV_FOURCC('I', 'Y', 'U', 'V') /* Use default codec for specified filename (Linux only) */
Run Code Online (Sandbox Code Playgroud)

我尝试安装qt4并使用WITH_QT标志重新配置,但这并没有改变任何东西.我也尝试取消注释代码的这一部分并重新安装opencv,但这也没有用.

我的最终目标是以任何方式有效地存储和检索每个像素16位的视频流(如32float工作正常,然后它不需要是完美的).现在我正在将16位打包到红色和绿色通道中,这就是为什么我需要它完美 - 因为红色通道中的1的误差在最终结果中乘以256.我没有成功使用任何可用的四分之一代码.

dla*_*nts 0

不久前我终于弄清楚了这个问题,终于有机会写出来给大家了。你可以在这里看到我的(相当hacky)解决方案:

http://denislantsman.com/?p=111


编辑:由于网站已关闭,以下总结了可以从 Wayback Machine 找到的内容:

  • 将帧保存为单独的 PNG 图像
  • 运行ffmpeg生成OpenCV可以打开的文件:

    ffmpeg -i ./outimg/深度%d.png -vcodec png 深度.mov

  • 以下 Python 代码片段对于保存各个帧可能很有用

    std::ostringstream out_depth;
    ...
    expand_depth(playback.pDepthMap, expanded_depth, playback.rows, playback.cols);
    out_depth << root << "/outimg/depth" << framecount << ".png";
    cv::imwrite(out_depth.str(), expanded_depth);
    framecount++;
    
    Run Code Online (Sandbox Code Playgroud)

    ...

  • 嘿,你的网站好像挂了。您还在某处写下了该解决方案吗? (3认同)