标签: object-detection

使用 >450K 实例训练 Dlib 对象检测器

dlib 是否能够使用大规模数据集来训练目标检测器。我有超过 450K 的面部图像来训练面部检测器。是否可以使用 Dlib 或者我需要转向另一个替代方案？

object-detection training-data dlib

ero*_*gol

lucky-day

3
推荐指数

1
解决办法

1530
查看次数

使用 K-means 聚类生成锚框，YOLO

我试图了解 YOLO 的工作原理以及它如何检测图像中的对象。我的问题是，k-means 聚类在检测对象周围的边界框方面起什么作用？谢谢。

bounding-box object-detection computer-vision k-means yolo

yin*_*ang

2019 06-04

3
推荐指数

1
解决办法

4888
查看次数

是否有必要在图像上标记一个类的每个对象？

我标记了一堆图像，用于训练 Faster-RCNN 网络，以用一个类进行对象检测。每个图像上大约有数百或数千个此类对象。我必须给所有这些都贴上标签吗？

目前，我在每个图像上标记了大约 20 到 80 个对象实例。因此我选择了我认为容易重新认识的对象。

当我开始使用此数据集训练网络时，损失在 0.9 到 20,000,000 之间变化

通常情况下，损失应该变得更小，但在我的情况下，它会减少并且具有极高的峰值。

object-detection tensorflow object-detection-api labelimg faster-rcnn

DE2*_*468

2021 07-18

3
推荐指数

1
解决办法

1247
查看次数

Tensorflow 对象检测 API 中预测数量的限制

我用 Tensorflow 对象检测 API 训练了一个 Faster R-CNN 模型，但遇到了一个奇怪的问题。尽管图像中有更多的对象，但模型的输出最多有 100 个预测。这是我测试过的每个图像的情况。

我在 10 个 GitHub 上发现了类似的问题，但据我所知，他们在这些方面做得并不多。 https://github.com/tensorflow/tensorflow/issues/30464

也许您过去遇到过类似的问题？知道如何解决这个问题吗？

python object-detection tensorflow object-detection-api

Kon*_*rad

lucky-day

3
推荐指数

1
解决办法

1228
查看次数

如何获取检测到的图像的轮廓（使用 cnn 对象检测）而不是它周围的矩形框？

我一直在谷歌搜索对象检测 1 周。每个人显示的内容类似于下图。

但我不想在检测到的对象周围出现方形框。我需要对象的粗略轮廓，如下图所示。

是否可以？如果可能，请简要说明一下。提前致谢。

machine-learning object-detection conv-neural-network

Cha*_*eja

lucky-day

3
推荐指数

1
解决办法

491
查看次数

yoloV3 (AlexeyAB)：费率为 0.0000

我正在使用 yoloV3 在我自己的训练集上进行训练。我已经正常编译，准备训练集，修改配置文件，.data，...

但是在训练时，yolo 输出关于学习率（即速率）保持在 0 即

 27: 1987.573730, 1807.166748 avg loss, 0.000000 rate, 2.820172 seconds, 216 images Loaded: 0.000047 seconds

Run Code Online (Sandbox Code Playgroud)

我不明白为什么？在配置文件中，训练率等于 0.001

object-detection computer-vision deep-learning yolo

Fen*_*III

lucky-day

3
推荐指数

1
解决办法

1267
查看次数

Detectron2 - 在目标检测阈值处提取区域特征

我正在尝试使用detectron2框架提取类检测高于某个阈值的区域特征。我稍后将在我的管道中使用这些功能（类似于：VilBert第 3.1 节训练 ViLBERT）到目前为止，我已经使用此配置训练了一个 Mask R-CNN，并在一些自定义数据上对其进行了微调。它表现良好。我想要做的是从我训练的模型中为生成的边界框提取特征。

编辑：我查看了关闭我帖子的用户所写的内容并试图对其进行改进。尽管读者需要了解我在做什么的上下文。如果您对我如何改进问题有任何想法，或者您对如何做我想做的事情有一些见解，欢迎您提供反馈！

我有个问题：

为什么我只得到一个预测实例，但是当我查看预测 CLS 分数时，有超过 1 个通过阈值？

我相信这是产生 ROI 特征的正确方法：

images = ImageList.from_tensors(lst[:1], size_divisibility=32).to("cuda")  # preprocessed input tensor
#setup config
cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_101_FPN_3x.yaml"))
cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
cfg.SOLVER.IMS_PER_BATCH = 1
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1  # only has one class (pnumonia)
#Just run these lines if you have the trained model im memory
cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7   # set the testing threshold for this model …

Run Code Online (Sandbox Code Playgroud)

python machine-learning object-detection pytorch detectron

Kev*_*vin

2020 06-19

3
推荐指数

1
解决办法

3202
查看次数

Detectron2 中每次迭代的图像数量

我是使用检测器 2 的新手，只是在学习它。这可能是一个菜鸟问题，但我真的需要答案。我发现与存储库中的时代数无关。

我们知道，epoch 意味着所有数据通过模型一次传递，batch 意味着整个数据集的某个子集，它有能力通过梯度下降影响损失。在这个模型中，(Detectron2) 我们有一个叫做迭代的东西。这个迭代是什么意思？这是否意味着通过模式或一个时期传递一批（考虑到每次迭代的时间，情况不应该如此）

我的问题是，我怎么知道将我的所有图像传递给模型的最小迭代次数，至少一次。

iteration object-detection detectron

Saw*_*aha

lucky-day

3
推荐指数

2
解决办法

2152
查看次数

将 xml 文件转换为 tfrecord 文件时出错

我正在 Macbook 上学习 TensorFlow 2 对象检测 API 教程

这是我在运行将 xmls 转换为 TFrecords 的给定脚本时得到的结果

Traceback (most recent call last):
  File "generate_tfrecord.py", line 62, in <module>
    label_map_dict = label_map_util.get_label_map_dict(label_map)
  File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 164, in get_label_map_dict
    label_map = load_labelmap(label_map_path)
  File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 133, in load_labelmap
    label_map_string = fid.read()
  File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 116, in read
    self._preread_check()
  File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 78, in _preread_check
    self._read_buf = _pywrap_file_io.BufferedInputStream(
TypeError: __init__(): incompatible constructor arguments. The following argument types are supported:
    1. tensorflow.python._pywrap_file_io.BufferedInputStream(arg0: str, arg1: int)

Invoked with: item …

Run Code Online (Sandbox Code Playgroud)

python object-detection tensorflow

Yue*_* Xu

2020 09-06

3
推荐指数

1
解决办法

2042
查看次数

Python 无法创建 NewWriteableFile (tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a NewWriteableFile: )

我正在尝试 TensorFlow 2.0 对象检测 API，当我尝试导出推理图时，我收到一条错误消息 tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a NewWriteableFile: .\exported-models\my_mobilenet_model\checkpoint\ckpt-0_temp_8cca890901704d9b9c1a0c5e959235fc/part-00000-of-00001.data-00000-of-00001.tempstate144711528486123721 : The system cannot find the path specified. ; No such process [Op:SaveV2]

我运行命令： python .\exporter_main_v2.py --input_type image_tensor --pipeline_config_path .\models\my_ssd_mobilenet_v2_fpnlite\pipeline.config --trained_checkpoint_dir .\models\my_ssd_mobilenet_v2_fpnlite\ --output_directory .\exported-models\my_mobilenet_model

我在运行命令的目录中有一个文件夹名称导出模型

python object-detection deep-learning tensorflow

Gle*_*gas

lucky-day

3
推荐指数

1
解决办法

534
查看次数