Caffe-Concat图层输入和输出

Ale*_*onk 3 machine-learning neural-network deep-learning caffe

我在Caffe 网站上阅读了有关Concat层的信息。但是,我不知道我的理解是否正确。

假设输入有两层,分别可以描述为W1 x H1 x D1W2 x H2 x D2,其中W是宽度,H是高度,D是深度。

因此,据我了解,将Axis设置为0时,输出将为(W1 + W2)x(H1 + H2)x D,其中D = D1 = D2

将Axis设置为1时,输出为W xH x(D1 + D2),其中H = H1 = H2W = W1 = W2

我的理解正确吗?如果没有,我将不胜感激。

Sha*_*hai 5

恐怕您有点失望 ...
看一下caffe.help

通常,caffe中的数据存储在4个 “斑点”中:Bx Cx Hx W(即,批次大小(按通道/功能/深度(按深度)按宽度))。
现在,如果您有两个blob B1x C1x H1x W1B2x C2x H2x W2,则可以沿它们axis: 1(沿通道尺寸)将它们串联起来,以形成一个输出Blob C=C1+C2。这仅当iff B1==B2H1==H2and 时才可能W1==W2,得到B1x (C1+C2)x H1xW1