标签: object-detection

使用 >450K 实例训练 Dlib 对象检测器

dlib 是否能够使用大规模数据集来训练目标检测器。我有超过 450K 的面部图像来训练面部检测器。是否可以使用 Dlib 或者我需要转向另一个替代方案?

object-detection training-data dlib

3
推荐指数
1
解决办法
1530
查看次数

使用 K-means 聚类生成锚框,YOLO

我试图了解 YOLO 的工作原理以及它如何检测图像中的对象。我的问题是,k-means 聚类在检测对象周围的边界框方面​​起什么作用?谢谢。

bounding-box object-detection computer-vision k-means yolo

3
推荐指数
1
解决办法
4888
查看次数

是否有必要在图像上标记一个类的每个对象?

我标记了一堆图像,用于训练 Faster-RCNN 网络,以用一个类进行对象检测。每个图像上大约有数百或数千个此类对象。我必须给所有这些都贴上标签吗?

目前,我在每个图像上标记了大约 20 到 80 个对象实例。因此我选择了我认为容易重新认识的对象。

当我开始使用此数据集训练网络时,损失在 0.9 到 20,000,000 之间变化

通常情况下,损失应该变得更小,但在我的情况下,它会减少并且具有极高的峰值。

object-detection tensorflow object-detection-api labelimg faster-rcnn

3
推荐指数
1
解决办法
1247
查看次数

Tensorflow 对象检测 API 中预测数量的限制

我用 Tensorflow 对象检测 API 训练了一个 Faster R-CNN 模型,但遇到了一个奇怪的问题。尽管图像中有更多的对象,但模型的输出最多有 100 个预测。这是我测试过的每个图像的情况。

我在 10 个 GitHub 上发现了类似的问题,但据我所知,他们在这些方面做得并不多。 https://github.com/tensorflow/tensorflow/issues/30464

也许您过去遇到过类似的问题?知道如何解决这个问题吗?

示例图像

python object-detection tensorflow object-detection-api

3
推荐指数
1
解决办法
1228
查看次数

如何获取检测到的图像的轮廓(使用 cnn 对象检测)而不是它周围的矩形框?

我一直在谷歌搜索对象检测 1 周。每个人显示的内容类似于下图。 在此处输入图片说明

但我不想在检测到的对象周围出现方形框。我需要对象的粗略轮廓,如下图所示。 在此处输入图片说明

是否可以?如果可能,请简要说明一下。提前致谢。

machine-learning object-detection conv-neural-network

3
推荐指数
1
解决办法
491
查看次数

yoloV3 (AlexeyAB):费率为 0.0000

我正在使用 yoloV3 在我自己的训练集上进行训练。我已经正常编译,准备训练集,修改配置文件,.data,...

但是在训练时,yolo 输出关于学习率(即速率)保持在 0 即

 27: 1987.573730, 1807.166748 avg loss, 0.000000 rate, 2.820172 seconds, 216 images Loaded: 0.000047 seconds
Run Code Online (Sandbox Code Playgroud)

我不明白为什么?在配置文件中,训练率等于 0.001

object-detection computer-vision deep-learning yolo

3
推荐指数
1
解决办法
1267
查看次数

Detectron2 - 在目标检测阈值处提取区域特征

我正在尝试使用detectron2框架提取类检测高于某个阈值的区域特征。我稍后将在我的管道中使用这些功能(类似于:VilBert第 3.1 节训练 ViLBERT)到目前为止,我已经使用此配置训练了一个 Mask R-CNN,并在一些自定义数据上对其进行了微调。它表现良好。我想要做的是从我训练的模型中为生成的边界框提取特征。

编辑:我查看了关闭我帖子的用户所写的内容并试图对其进行改进。尽管读者需要了解我在做什么的上下文。如果您对我如何改进问题有任何想法,或者您对如何做我想做的事情有一些见解,欢迎您提供反馈!

我有个问题:

  1. 为什么我只得到一个预测实例,但是当我查看预测 CLS 分数时,有超过 1 个通过阈值?

我相信这是产生 ROI 特征的正确方法:

images = ImageList.from_tensors(lst[:1], size_divisibility=32).to("cuda")  # preprocessed input tensor
#setup config
cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_101_FPN_3x.yaml"))
cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
cfg.SOLVER.IMS_PER_BATCH = 1
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1  # only has one class (pnumonia)
#Just run these lines if you have the trained model im memory
cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7   # set the testing threshold for this model …
Run Code Online (Sandbox Code Playgroud)

python machine-learning object-detection pytorch detectron

3
推荐指数
1
解决办法
3202
查看次数

Detectron2 中每次迭代的图像数量

我是使用检测器 2 的新手,只是在学习它。这可能是一个菜鸟问题,但我真的需要答案。我发现与存储库中的时代数无关。

我们知道,epoch 意味着所有数据通过模型一次传递,batch 意味着整个数据集的某个子集,它有能力通过梯度下降影响损失。在这个模型中,(Detectron2) 我们有一个叫做迭代的东西。这个迭代是什么意思?这是否意味着通过模式或一个时期传递一批(考虑到每次迭代的时间,情况不应该如此)

我的问题是,我怎么知道将我的所有图像传递给模型的最小迭代次数,至少一次。

iteration object-detection detectron

3
推荐指数
2
解决办法
2152
查看次数

将 xml 文件转换为 tfrecord 文件时出错

我正在 Macbook 上学习 TensorFlow 2 对象检测 API 教程

这是我在运行将 xmls 转换为 TFrecords 的给定脚本时得到的结果

Traceback (most recent call last):
  File "generate_tfrecord.py", line 62, in <module>
    label_map_dict = label_map_util.get_label_map_dict(label_map)
  File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 164, in get_label_map_dict
    label_map = load_labelmap(label_map_path)
  File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 133, in load_labelmap
    label_map_string = fid.read()
  File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 116, in read
    self._preread_check()
  File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 78, in _preread_check
    self._read_buf = _pywrap_file_io.BufferedInputStream(
TypeError: __init__(): incompatible constructor arguments. The following argument types are supported:
    1. tensorflow.python._pywrap_file_io.BufferedInputStream(arg0: str, arg1: int)

Invoked with: item …
Run Code Online (Sandbox Code Playgroud)

python object-detection tensorflow

3
推荐指数
1
解决办法
2042
查看次数

Python 无法创建 NewWriteableFile (tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a NewWriteableFile: )

我正在尝试 TensorFlow 2.0 对象检测 API,当我尝试导出推理图时,我收到一条错误消息 tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a NewWriteableFile: .\exported-models\my_mobilenet_model\checkpoint\ckpt-0_temp_8cca890901704d9b9c1a0c5e959235fc/part-00000-of-00001.data-00000-of-00001.tempstate144711528486123721 : The system cannot find the path specified. ; No such process [Op:SaveV2]

我运行命令: python .\exporter_main_v2.py --input_type image_tensor --pipeline_config_path .\models\my_ssd_mobilenet_v2_fpnlite\pipeline.config --trained_checkpoint_dir .\models\my_ssd_mobilenet_v2_fpnlite\ --output_directory .\exported-models\my_mobilenet_model

我在运行命令的目录中有一个文件夹名称导出模型

python object-detection deep-learning tensorflow

3
推荐指数
1
解决办法
534
查看次数