小编kli*_*lpr的帖子

如何计算感受野大小?

我正在阅读有关使用CNN(卷积神经网络)进行物体检测的论文.

丰富的要素层次结构,用于准确的对象检测和语义分割

以下是关于接受领域的引用:

The pool5 feature map is 6x6x256 = 9216 dimensional. Ignoring boundary effects, each pool5 unit has a receptive field of 195x195 pixels in the original 227x227 pixel input. A central pool5 unit has a nearly global view,
while one near the edge has a smaller, clipped support.
Run Code Online (Sandbox Code Playgroud)

我的问题是:

  1. 接受场的定义是什么?
  2. 他们如何计算感受野的大小和位置?
  3. 我们如何使用caffe/pycaffe计算感受野的边界矩形?

computer-vision deep-learning

15
推荐指数
3
解决办法
1万
查看次数

caffe数据层示例一步一步

我想找一个要学习的caffe python数据层示例.我知道Fast-RCNN有一个python数据层,但由于我不熟悉对象检测,所以它相当复杂.
所以我的问题是,是否有一个python数据层示例,我可以学习如何定义自己的数据准备过程?
例如,如何定义python数据层比caffe做更多的数据扩充(例如转换,旋转等)"ImageDataLayer".

非常感谢你

neural-network deep-learning caffe pycaffe

10
推荐指数
2
解决办法
7651
查看次数

python opencv cv2.cv.CV_CAP_PROP_FRAME_COUNT获取错误的数字

import os
import cv2
path='/home/nlpr4/video-data/UCF-101/GolfSwing/v_GolfSwing_g24_c06.avi'
cap=cv2.VideoCapture(path)
video_length=int(cap.get(cv2.cv.CV_CAP_PROP_FRAME_COUNT))

success=True
count=0
while success:
    success,image=cap.read()
    if success==False:
        break
    count=count+1

print video_length,count
Run Code Online (Sandbox Code Playgroud)

输出:

149 
146
Run Code Online (Sandbox Code Playgroud)

为什么这两个数字不同?怎么了?

python opencv

9
推荐指数
2
解决办法
1万
查看次数

ImageDataLayer和LMDB数据层之间的速度

Caffe支持LMDB数据层和ImageDataLayer.从某些数据集创建LMDB数据库需要一些时间和大量空间.相比之下,ImageDataLayer只使用非常方便的txt文件.我的问题是,这两种层之间存在很大的速度差异吗?非常感谢你!

deep-learning caffe

6
推荐指数
1
解决办法
2129
查看次数

caffe LayerSetUp和Reshape?

我正在阅读caffe源代码.
我很困惑LayerSetUpReshape方法.
有些层有这两种方法,有些层有一层或没有...为什么?任何人都可以向我解释这个吗?

machine-learning neural-network deep-learning caffe

1
推荐指数
1
解决办法
771
查看次数