使用 1D DCT 的 2D 离散余弦变换

bum*_*ync 4 matlab signal-processing image-processing dct

我正在尝试使用 1D DCT 运算对图像实施 2D 离散余弦变换。如果我将其与dct2MATLAB 函数进行比较,我的输出是不正确的。我不明白我的代码出了什么问题以及发生在哪里。

如果有人可以指出错误或任何其他建议,那将非常有帮助。

这是我用 MATLAB 编写的代码

% main function
signal=rand(100);
signal_dct=myDCT(signal);
figure; imshow((signal_dct));

% function to calculate 2D DCT of an image
function res=myDCT(signal)

    signal=double(signal);

    l=size(signal,1);

    res=zeros(l);  %initialize the final result matrix

    for k=1:l     %calculate 1D DCT of each row of image
        res(k,:)=mdct(signal(k,:));  
    end

    for k=1:l   %calculate 1D DCT of each column of image
        res(:,k)=mdct(res(:,k));
    end
end

%% function to calculate 1D DFT of a 1D signal
function res=mdct(signal)

    l=size(signal,1);

    for i=1:l

        if i==1   %for signal index of 1, alpha is 1/sqrt(l)
            alpha=sqrt(1/l);
        else   %for signal index of greater than 1
            alpha=sqrt(2/l);
        end

        j=[1:l];
        % summation calculates single entry of res by applying the  
        % formula of DCT on the signal
        summation=sum(sum(signal(j)*cos((pi*(2*(j-1)+1)*(i-1))/(2*l))));
        res(i)=alpha*summation;        
    end
end
Run Code Online (Sandbox Code Playgroud)

ray*_*ica 6

你是正确的,二维 DCT 是可分离的。您只需首先将一维 DCT 应用于每一行,然后获取中间结果并将其应用于列。然而,你有两个根本性的错误。让我们来看看它们。

错误 #1 - DCT 的大小不正确

具体来说,看看你的mdct函数中的这个语句:

l=size(signal,1);
Run Code Online (Sandbox Code Playgroud)

因为您要对每一行应用 DCT,然后对每一列应用 DCT,所以只有在将 DCT 应用于 columns 时,上述方法才有效如果输入是一列,size(signal,1)肯定会给出输入向量的长度。但是,如果您的输入是row,则 的输出将为1。因此,您应该替换为,以便确保获得元素的总数 - 无论输入是行还是列。size(signal,1)size(signal,1)numel

另外,如果您想让代码兼容在 DCT 循环中进行求和,则应确保输入是行向量,无论。因此,请执行以下操作:

l = numel(signal);
signal = signal(:).';
Run Code Online (Sandbox Code Playgroud)

第一行确定输入信号有多少个元素,第二行确保我们有一个行向量。这是通过(:)将元素展开为列向量,然后执行.'此操作以确保我们转置结果以获得行向量来完成的。

错误 #2 - 求和语句不正确

接下来,您必须在求和中进行逐元素乘法才能得到您想要的结果。您也不需要sum在那里进行额外的呼叫。这是多余的。因此,将求和语句修改为:

summation=sum(signal.*cos((pi*(2*(j-1)+1).*(i-1))/(2*l)));
Run Code Online (Sandbox Code Playgroud)

不需要这样做signal(j),因为j跨越向量的整个长度,您可以使用 来做到这一点signal


进行这些更改后,我在较小尺寸的矩阵上进行了此操作,以确保我们得到相同的结果:

rng(123123);
signal=rand(7);
signal_dct=myDCT(signal);
signal_dct2 = dct2(signal);
Run Code Online (Sandbox Code Playgroud)

最后一行代码调用,dct2以便我们可以将自定义函数的结果与dct2给我们的结果进行比较。

我们得到:

>> signal_dct

signal_dct =

    3.7455   -0.1854   -0.1552    0.3949    0.2182   -0.3707    0.2621
   -0.2747    0.1566   -0.0955    0.1415    0.3156   -0.0503    0.8581
   -0.2095    0.0233   -0.2769   -0.4341   -0.1639    0.3700   -0.2282
   -0.0282    0.0791    0.0517    0.4749   -0.0169   -0.4327    0.0427
   -0.4047   -0.4383    0.3415   -0.1120   -0.0229    0.0310    0.3767
   -0.6058   -0.0389   -0.3460    0.2732   -0.2395   -0.2961    0.1789
   -0.0648   -0.3173   -0.0584   -0.3461   -0.1866    0.0301    0.2710

>> signal_dct2

signal_dct2 =

    3.7455   -0.1854   -0.1552    0.3949    0.2182   -0.3707    0.2621
   -0.2747    0.1566   -0.0955    0.1415    0.3156   -0.0503    0.8581
   -0.2095    0.0233   -0.2769   -0.4341   -0.1639    0.3700   -0.2282
   -0.0282    0.0791    0.0517    0.4749   -0.0169   -0.4327    0.0427
   -0.4047   -0.4383    0.3415   -0.1120   -0.0229    0.0310    0.3767
   -0.6058   -0.0389   -0.3460    0.2732   -0.2395   -0.2961    0.1789
   -0.0648   -0.3173   -0.0584   -0.3461   -0.1866    0.0301    0.2710
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,两个结果都是匹配的。在我看来很好!


为了确保我们的一致性,这是您的两个函数的完整代码清单,以及我所做的修改:

% function to calculate 2D DCT of an image
function res=myDCT(signal)

    signal=double(signal);

    l=size(signal,1);

    res = zeros(l);

    for k=1:l     %calculate 1D DCT of each row of image
        res(k,:)=mdct(signal(k,:));  
    end

    for k=1:l   %calculate 1D DCT of each column of image
        res(:,k)=mdct(res(:,k));
    end
end

%% function to calculate 1D DFT of a 1D signal
function res=mdct(signal)

    %// Change
    l = numel(signal);
    signal = signal(:).';

    for i=1:l

        if i==1   %for signal index of 1, alpha is 1/sqrt(l)
            alpha=sqrt(1/l);
        else   %for signal index of greater than 1
            alpha=sqrt(2/l);
        end

        j=[1:l];
        % summation calculates single entry of res by applying the  
        % formula of DCT on the signal
        %// Change
        summation=sum(signal.*cos((pi*(2*(j-1)+1).*(i-1))/(2*l)));
        res(i)=alpha*summation;        
    end
end
Run Code Online (Sandbox Code Playgroud)