Ara*_*orn 14 rgb convolution matrix-multiplication dot-product
假设我们有一个单一频道图像(5x5)
A = [ 1 2 3 4 5
6 7 8 9 2
1 4 5 6 3
4 5 6 7 4
3 4 5 6 2 ]
Run Code Online (Sandbox Code Playgroud)
和过滤器K(2x2)
K = [ 1 1
1 1 ]
Run Code Online (Sandbox Code Playgroud)
应用卷积的一个例子(让我们从A中取出第一个2x2)将是
1*1 + 2*1 + 6*1 + 7*1 = 16
Run Code Online (Sandbox Code Playgroud)
这非常简单.但是,让我们向矩阵A引入深度因子,即在深度网络中具有3个通道或甚至转换层的RGB图像(深度= 512).如何使用相同的滤波器完成卷积运算?类似的工作对于RGB情况非常有帮助.
Mut*_*nan 16
假设我们有一个由矩阵 A 给出的 3 通道 (RGB) 图像
A = [[[[198 218 227]
[196 216 225]
[196 214 224]
...
...
[185 201 217]
[176 192 208]
[162 178 194]]
和一个模糊的内核
K = [[0.1111, 0.1111, 0.1111],
[0.1111, 0.1111, 0.1111],
[0.1111, 0.1111, 0.1111]]
#实际上是 0.111 ~= 1/9
正如您在图像中看到的,每个通道都被单独卷积,然后组合形成一个像素。
它们与您对单通道图像的处理方式相同,只是您将获得三个矩阵而不是一个. 这是关于CNN基础知识的讲义,我认为这可能对你有所帮助.