OpenCV的cvMat的内存结构是什么?

Sev*_* Ba 14 opencv

想象一下,我有以下几点:

CvMat* mat = cvCreateMat(3,3,CV_16SC3)
Run Code Online (Sandbox Code Playgroud)

这是通道3的3x3整数矩阵.

现在,如果您查看OpenCV文档,您会发现以下内容作为cvMat的减速:

typedef struct CvMat {

int type;
int step;

int* refcount;

union
{
    uchar* ptr;
    short* s;
    int* i;
    float* fl;
    double* db;
} data;

union
{
    int rows;
    int height;
};

union
{
    int cols;
    int width;
};
} CvMat;
Run Code Online (Sandbox Code Playgroud)

现在,我想使用data.ptr,它是指向存储在cvMat中的数据的指针.但是,我很难理解内存是如何布局的.如果我有一个3通道矩阵,这是如何工作的?对于一个通道来说它很简单,因为它只是一个简单的MxN矩阵,其中M是行,N是cols.但对于3通道,这些MxN矩阵中有3个吗?有人可以告诉我如何通过data.ptr进行3通道矩阵的初始化以及如何访问这些值吗?谢谢.

Jac*_*cob 19

该网页是对OpenCV 1.1的精彩介绍.我建议使用最新版本的Open CV 2.0,它具有Mat处理图像,矩阵等的通用类,与OpenCV 1.1不同.

上面的网页详细介绍了以下多通道图像中元素访问的方法:

间接访问:(一般,但效率低,访问任何类型的图像)

对于多通道浮点(或字节)图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
CvScalar s;
s=cvGet2D(img,i,j); // get the (i,j) pixel value
printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);
s.val[0]=111;
s.val[1]=111;
s.val[2]=111;
cvSet2D(img,i,j,s); // set the (i,j) pixel value
Run Code Online (Sandbox Code Playgroud)

直接访问:(高效访问,但容易出错)

对于多通道浮动图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R
Run Code Online (Sandbox Code Playgroud)

使用指针直接访问:(在限制性假设下简化和有效访问)

对于多通道浮点图像(假设4字节对齐):

IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
int height     = img->height;
int width      = img->width;
int step       = img->widthStep/sizeof(float);
int channels   = img->nChannels;
float * data    = (float *)img->imageData;
data[i*step+j*channels+k] = 111;
Run Code Online (Sandbox Code Playgroud)

使用c ++包装器直接访问:(简单高效的访问)

为单通道字节图像,多通道字节图像和多通道浮点图像定义c ++包装器:

template<class T> class Image
  {
    private:
    IplImage* imgp;
    public:
    Image(IplImage* img=0) {imgp=img;}
    ~Image(){imgp=0;}
    void operator=(IplImage* img) {imgp=img;}
    inline T* operator[](const int rowIndx) {
      return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));}
  };

  typedef struct{
    unsigned char b,g,r;
  } RgbPixel;

  typedef struct{
    float b,g,r;
  } RgbPixelFloat;

  typedef Image<RgbPixel>       RgbImage;
  typedef Image<RgbPixelFloat>  RgbImageFloat;
  typedef Image<unsigned char>  BwImage;
  typedef Image<float>          BwImageFloat;
Run Code Online (Sandbox Code Playgroud)

对于多通道浮动图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);
RgbImageFloat imgA(img);
imgA[i][j].b = 111;
imgA[i][j].g = 111;
imgA[i][j].r = 111;
Run Code Online (Sandbox Code Playgroud)

  • 这个答案应该涵盖了cvMat的一些细节.完全没有提到cvMat (2认同)