我正在阅读有关使用CNN(卷积神经网络)进行物体检测的论文.
以下是关于接受领域的引用:
The pool5 feature map is 6x6x256 = 9216 dimensional. Ignoring boundary effects, each pool5 unit has a receptive field of 195x195 pixels in the original 227x227 pixel input. A central pool5 unit has a nearly global view,
while one near the edge has a smaller, clipped support.
Run Code Online (Sandbox Code Playgroud)
我的问题是:
我想找一个要学习的caffe python数据层示例.我知道Fast-RCNN有一个python数据层,但由于我不熟悉对象检测,所以它相当复杂.
所以我的问题是,是否有一个python数据层示例,我可以学习如何定义自己的数据准备过程?
例如,如何定义python数据层比caffe做更多的数据扩充(例如转换,旋转等)"ImageDataLayer".
非常感谢你
import os
import cv2
path='/home/nlpr4/video-data/UCF-101/GolfSwing/v_GolfSwing_g24_c06.avi'
cap=cv2.VideoCapture(path)
video_length=int(cap.get(cv2.cv.CV_CAP_PROP_FRAME_COUNT))
success=True
count=0
while success:
success,image=cap.read()
if success==False:
break
count=count+1
print video_length,count
Run Code Online (Sandbox Code Playgroud)
输出:
149
146
Run Code Online (Sandbox Code Playgroud)
为什么这两个数字不同?怎么了?
Caffe支持LMDB数据层和ImageDataLayer.从某些数据集创建LMDB数据库需要一些时间和大量空间.相比之下,ImageDataLayer只使用非常方便的txt文件.我的问题是,这两种层之间存在很大的速度差异吗?非常感谢你!
我正在阅读caffe源代码.
我很困惑LayerSetUp和Reshape方法.
有些层有这两种方法,有些层有一层或没有...为什么?任何人都可以向我解释这个吗?