Clo*_*ave 2 artificial-intelligence neural-network conv-neural-network
问题在于卷积神经网络的数学细节.假设网络的结构(其目标是图像分类)是这样的
从我到目前为止的读数,我已经知道每个6x5x5矩阵都连接到FCN-1.我有两个问题,这两个问题都与一层输出到另一层的方式有关.
通常一些CNN(如VGG 16,VGG 19)所做的是,它们将MAX_POOL层的3D张量输出展平,因此在您的示例中,FC层的输入将变为(None,150),但其他CNN(如ResNet50)使用全局得到的最大函数6x1x1(输出张量的维数)然后被展平(将成为(None,6))并被馈送到FC层.
要回答你的查询,其中展平会破坏空间排列,当你展平图像时,假设像素位置是X ij(即第i行,第j列= n*i+j,其中n是图像的宽度),那么基于矩阵表示我们可以说对于其他邻居,其上邻居是X i-1,j (n*(i-1)+j)等等,因为对于像素及其相邻像素存在共同关系,FC层将自动调整权重以反映该信息.
因此,您可以将convo->activation->pooling图层组视为特征提取图层,其输出张量(类似于矢量中的尺寸/特征)将被馈送到网络末端的标准ANN中.