小编Jun*_*ers的帖子

卷积神经网络 - 多通道

当输入层存在多个通道时,如何进行卷积运算？(例如RGB)

在对CNN的体系结构/实现进行一些阅读之后,我理解特征映射中的每个神经元都引用由内核大小定义的图像的NxM像素.然后通过学习NxM权重集(内核/滤波器),求和并输入到激活函数中的特征映射来对每个像素进行因子分解.对于一个简单的灰度图像,我想操作将遵循以下伪代码:

for i in range(0, image_width-kernel_width+1):
    for j in range(0, image_height-kernel_height+1):
        for x in range(0, kernel_width):
            for y in range(0, kernel_height):
                sum += kernel[x,y] * image[i+x,j+y]

        feature_map[i,j] = act_func(sum)
        sum = 0.0

Run Code Online (Sandbox Code Playgroud)

但是我不明白如何扩展此模型来处理多个通道.每个要素图需要三个单独的权重集,每种颜色之间是否共享？

参考本教程的"共享权重"部分:http://deeplearning.net/tutorial/lenet.html 要素图中的每个神经元都参考层m-1,颜色从不同的神经元引用.我不明白他们在这里表达的关系.是神经元内核还是像素,为什么它们会引用图像的不同部分？

根据我的例子,似乎单个神经元内核是图像中特定区域所独有的.为什么他们将RGB组件分成几个区域？

artificial-intelligence convolution computer-vision neural-network

Jun*_*ers

lucky-day

20
推荐指数

2
解决办法

1万
查看次数