标签: object-detection

如何在 Blender 中提取模型的边界框?

我正在使用 Blender 渲染模型。模型由位置发生变化的相机捕获。然后我将图像写入文件。如何在图像中找到边界框,以便此框可用于在训练对象检测模型中有用的注释?

bounding-box object-detection blender

3
推荐指数
1
解决办法
8408
查看次数

我可以使用 OpenCV train_cascade 检测到的最小尺寸对象是多少?

我正在为电源插座创建分类器(特别是在标准插座面板上出现两次的三个开孔,而不是整个面板本身)。

在此处输入图片说明

我的问题是,正图像的理想特征是什么,我应该将什么宽度和高度传递给 train_cascade 以使我的对象检测器能够检测到尽可能小的出口?即从尽可能远的距离检测它们?我也关心准确性,并且对需要数周时间训练的分类器很好(假设它实际上正在取得进展)。

还有一个问题来增加我对此的理解:我传递给train_cascade搜索框的尺寸的宽度和高度是否会传递到每个图像上?如果是这样,我希望我的探测器检测到非常小的物体,而不是我应该通过一个小的宽度和高度,对吗?

我希望能够检测非常大和非常小的插座实例。从非常近的地方(相机实际上距离插座 3 英寸)到至少几英尺远。

opencv object-detection viola-jones cascade-classifier

3
推荐指数
1
解决办法
1770
查看次数

我如何使用带有图像单应性的Orb探测器?

我想使用orb探测器在找到的图像周围绘制一个边界框,类似于这里使用筛选探测器的示例:SIFT Refrence

Linked示例使用FlannBasedMatcher.我的代码使用BFMatcher.我在使用的Matcher中没有偏好.

        MIN_MATCH_COUNT = 10

        img1 = cv2.imread('box.png',0)
        img2 = cv2.imread('box_in_scene.png',0)

        orb = cv2.ORB_create()

        kp1, des1 = orb.detectAndCompute(img1,None)
        kp2, des2 = orb.detectAndCompute(img2,None)

        bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
        matches = bf.match(des1,des2)
Run Code Online (Sandbox Code Playgroud)

我将如何继续使用单应性来绘制box_in_scene图像?

编辑:我尝试了以下,但输出不是预期的.

src_pts = np.float32([ kp1[m.queryIdx].pt for m in matches[:50] ]).reshape(-1,1,2)
dst_pts = np.float32([ kp2[m.trainIdx].pt for m in matches[:50] ]).reshape(-1,1,2)
M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC,5.0)
matchesMask = mask.ravel().tolist()
h,w = img1.shape
pts = np.float32([ [0,0],[0,h-1],[w-1,h-1],[w-1,0] ]).reshape(-1,1,2)
dst = cv2.perspectiveTransform(pts,M)
Run Code Online (Sandbox Code Playgroud)

python opencv object-detection homography orb

3
推荐指数
1
解决办法
3724
查看次数

Tensorflow对象检测:使用Adam代替RMSProp

我正在使用此[.config文件] [1]训练CNN:

rms_prop_optimizer: {
    learning_rate: {
      exponential_decay_learning_rate {
        initial_learning_rate: 0.004
        decay_steps: 800720
        decay_factor: 0.95
      }
    }
   momentum_optimizer_value: 0.9
   decay: 0.9
   epsilon: 1.0
}   
Run Code Online (Sandbox Code Playgroud)

}
正如你可以看到有一个rms_prop的优化。如果我想使用亚当怎么办?我应该如何编辑该文件?

object-detection tensorflow

3
推荐指数
1
解决办法
1882
查看次数

Tensorflow 对象检测 API 数据增强边界框

对于通过使用model_main.py的Tensorflow API目标检测,当我使用即random_horizontal_flipdata_augmentation_optionstrain_config我的pipeline.config的,是我的边框也受到了影响?这非常重要,否则这些选项将不适用。是同一个问题,但没有正确回答。

bounding-box object-detection tensorflow data-augmentation

3
推荐指数
1
解决办法
2613
查看次数

yolov3 中 CNN 的真实层数是多少?

我真的对 yolov3 的架构感到困惑。我已经阅读了有关它的文档和论文。有人说它有 103 个卷积层,其他人说它有 53 个层。但是当你计算 cfg 文件中的卷积层时(下载后)它大约是 75!...这里遗漏了什么?我该怎么做才能找到它?这个问题对我们很重要,因为我们需要在论文中引用这个架构,我们需要知道确切的大小层数...帮帮我伙计们

python object-detection conv-neural-network yolo

3
推荐指数
2
解决办法
4890
查看次数

YOLOv3 SPP和YOLOv3的区别?

我找不到任何关于 YOLOv3 SPPmAP比 YOLOv3更好的解释。作者本人在他的 repo 中将 YOLOv3 SPP 声明为:

带有空间金字塔池化的 YOLOv3 或其他东西

但我还是不太明白。在yolov3-spp.cfg我注意到有一些补充

575 ### SPP ###
576 [maxpool]
577 stride=1
578 size=5
579 
580 [route]
581 layers=-2
582 
583 [maxpool]
584 stride=1
585 size=9
586 
587 [route]
588 layers=-4
589 
590 [maxpool]
591 stride=1
592 size=13
593 
594 [route]
595 layers=-1,-3,-5,-6
596 
597 ### End SPP ###
598 
599 [convolutional]
600 batch_normalize=1
601 filters=512
602 size=1
603 stride=1
604 pad=1
605 activation=leaky
Run Code Online (Sandbox Code Playgroud)

任何人都可以进一步解释 YOLOv3 SPP …

object-detection conv-neural-network darknet yolo

3
推荐指数
2
解决办法
2万
查看次数

如何使 tensorflow 对象检测更快-r cnn 模型在 Android 上工作?

我有一个关于Tensorflows Object Detection API 的问题。我用我自己的交通标志分类数据集训练了 Faster R-CNN Inception v2 模型,我想将它部署到 Android,但适用于 Android和/或Tensorflow Lite 的Tensorflows Object Detection API似乎只支持 SSD 模型。

有没有办法将 Faster R-CNN 模型部署到 Android?我的意思是如何将 Faster R-CNN 的冻结推理图放到 android API 而不是 SSD 冻结推理图?

python android object-detection tensorflow faster-rcnn

3
推荐指数
1
解决办法
3116
查看次数

Yolo 对象检测:包括不包含要预测的类的图像?

我想在我自己的数据集上训练小 yolo。我想预测 3 个类别:汽车、行人和骑自行车的人;所有这些都已被注释。

我的数据集还包括不包含这些类的图像(因此没有注释)。我应该在培训中包含这些图像吗?为什么或者为什么不?

谢谢!

machine-learning object-detection deep-learning yolo

3
推荐指数
3
解决办法
3112
查看次数

如何在 OpenCV Haar 分类器中显示最大的矩形

我已经使用 haar 级联对象检测在汽车的侧视图上训练了正面和负面图像,现在当我使用级联 xml 文件来预测图像中的汽车时,我得到了多个矩形。

现在
1)为什么我的对象周围有多个矩形。
2)如何只显示图像中检测到的最大矩形

输出图像

在此处输入图片说明

这是我在每个图像上得到的输出类型

代码

car_cascade = cv2.CascadeClassifier('data/cascade.xml')
img = cv2.imread('test/46.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cars = car_cascade.detectMultiScale(gray, 1.3, 5)
for (x,y,w,h) in cars:
    img = cv2.rectangle(img,(x,y),(x+w,y+h),(0,255,0),2)    

cv2.imshow('img',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
Run Code Online (Sandbox Code Playgroud)

python opencv image-processing object-detection computer-vision

3
推荐指数
1
解决办法
1072
查看次数