dlib 是否能够使用大规模数据集来训练目标检测器。我有超过 450K 的面部图像来训练面部检测器。是否可以使用 Dlib 或者我需要转向另一个替代方案?
我试图了解 YOLO 的工作原理以及它如何检测图像中的对象。我的问题是,k-means 聚类在检测对象周围的边界框方面起什么作用?谢谢。
我标记了一堆图像,用于训练 Faster-RCNN 网络,以用一个类进行对象检测。每个图像上大约有数百或数千个此类对象。我必须给所有这些都贴上标签吗?
目前,我在每个图像上标记了大约 20 到 80 个对象实例。因此我选择了我认为容易重新认识的对象。
当我开始使用此数据集训练网络时,损失在 0.9 到 20,000,000 之间变化
通常情况下,损失应该变得更小,但在我的情况下,它会减少并且具有极高的峰值。
object-detection tensorflow object-detection-api labelimg faster-rcnn
我用 Tensorflow 对象检测 API 训练了一个 Faster R-CNN 模型,但遇到了一个奇怪的问题。尽管图像中有更多的对象,但模型的输出最多有 100 个预测。这是我测试过的每个图像的情况。
我在 10 个 GitHub 上发现了类似的问题,但据我所知,他们在这些方面做得并不多。 https://github.com/tensorflow/tensorflow/issues/30464
也许您过去遇到过类似的问题?知道如何解决这个问题吗?
我正在使用 yoloV3 在我自己的训练集上进行训练。我已经正常编译,准备训练集,修改配置文件,.data,...
但是在训练时,yolo 输出关于学习率(即速率)保持在 0 即
27: 1987.573730, 1807.166748 avg loss, 0.000000 rate, 2.820172 seconds, 216 images Loaded: 0.000047 seconds
Run Code Online (Sandbox Code Playgroud)
我不明白为什么?在配置文件中,训练率等于 0.001
我正在尝试使用detectron2框架提取类检测高于某个阈值的区域特征。我稍后将在我的管道中使用这些功能(类似于:VilBert第 3.1 节训练 ViLBERT)到目前为止,我已经使用此配置训练了一个 Mask R-CNN,并在一些自定义数据上对其进行了微调。它表现良好。我想要做的是从我训练的模型中为生成的边界框提取特征。
编辑:我查看了关闭我帖子的用户所写的内容并试图对其进行改进。尽管读者需要了解我在做什么的上下文。如果您对我如何改进问题有任何想法,或者您对如何做我想做的事情有一些见解,欢迎您提供反馈!
我有个问题:
我相信这是产生 ROI 特征的正确方法:
images = ImageList.from_tensors(lst[:1], size_divisibility=32).to("cuda") # preprocessed input tensor
#setup config
cfg = get_cfg()
cfg.merge_from_file(model_zoo.get_config_file("COCO-InstanceSegmentation/mask_rcnn_R_101_FPN_3x.yaml"))
cfg.MODEL.WEIGHTS = os.path.join(cfg.OUTPUT_DIR, "model_final.pth")
cfg.SOLVER.IMS_PER_BATCH = 1
cfg.MODEL.ROI_HEADS.NUM_CLASSES = 1 # only has one class (pnumonia)
#Just run these lines if you have the trained model im memory
cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.7 # set the testing threshold for this model …Run Code Online (Sandbox Code Playgroud) 我是使用检测器 2 的新手,只是在学习它。这可能是一个菜鸟问题,但我真的需要答案。我发现与存储库中的时代数无关。
我们知道,epoch 意味着所有数据通过模型一次传递,batch 意味着整个数据集的某个子集,它有能力通过梯度下降影响损失。在这个模型中,(Detectron2) 我们有一个叫做迭代的东西。这个迭代是什么意思?这是否意味着通过模式或一个时期传递一批(考虑到每次迭代的时间,情况不应该如此)
我的问题是,我怎么知道将我的所有图像传递给模型的最小迭代次数,至少一次。
我正在 Macbook 上学习 TensorFlow 2 对象检测 API 教程
这是我在运行将 xmls 转换为 TFrecords 的给定脚本时得到的结果
Traceback (most recent call last):
File "generate_tfrecord.py", line 62, in <module>
label_map_dict = label_map_util.get_label_map_dict(label_map)
File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 164, in get_label_map_dict
label_map = load_labelmap(label_map_path)
File "/usr/local/lib/python3.8/site-packages/object_detection/utils/label_map_util.py", line 133, in load_labelmap
label_map_string = fid.read()
File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 116, in read
self._preread_check()
File "/usr/local/lib/python3.8/site-packages/tensorflow/python/lib/io/file_io.py", line 78, in _preread_check
self._read_buf = _pywrap_file_io.BufferedInputStream(
TypeError: __init__(): incompatible constructor arguments. The following argument types are supported:
1. tensorflow.python._pywrap_file_io.BufferedInputStream(arg0: str, arg1: int)
Invoked with: item …Run Code Online (Sandbox Code Playgroud) 我正在尝试 TensorFlow 2.0 对象检测 API,当我尝试导出推理图时,我收到一条错误消息 tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a NewWriteableFile: .\exported-models\my_mobilenet_model\checkpoint\ckpt-0_temp_8cca890901704d9b9c1a0c5e959235fc/part-00000-of-00001.data-00000-of-00001.tempstate144711528486123721 : The system cannot find the path specified. ; No such process [Op:SaveV2]
我运行命令: python .\exporter_main_v2.py --input_type image_tensor --pipeline_config_path .\models\my_ssd_mobilenet_v2_fpnlite\pipeline.config --trained_checkpoint_dir .\models\my_ssd_mobilenet_v2_fpnlite\ --output_directory .\exported-models\my_mobilenet_model
我在运行命令的目录中有一个文件夹名称导出模型
object-detection ×10
python ×4
tensorflow ×4
detectron ×2
yolo ×2
bounding-box ×1
dlib ×1
faster-rcnn ×1
iteration ×1
k-means ×1
labelimg ×1
pytorch ×1