使用初始V3在Tensorflow中定位对象

Ant*_*udd 2 python machine-learning neural-network deep-learning tensorflow

我看过这篇博文,介绍了如何使用Google的图像分类模型Inception V3本地化图像中的对象.

"我们可以将8x8x2048表示解释为特征网格,将图像分解为8个水平和8个垂直网格方块."

任何人都可以解释我如何在python中访问8x8x2048的Inception层?然后使用1x1卷积将这些向量中的每一个映射到类标签?

谢谢!

yue*_*ngz 5

在tensorflow的回购以来模型调用inception.slim.inception_v3,您需要修改网络功能在这里为1x1的卷积添加更多的层.

变化将非常小,您可以按照它构建其他图层的方式.简单来说,图层就像:

net = ops.conv2d(net, 2048, [1, 1])
Run Code Online (Sandbox Code Playgroud)