我尝试使用David Lowe 的实现和OpenCV 实现对几个不同的对象进行对象检测(只是在此代码中更改了 'SurfFeatureDetector' -> 'SiftFeatureDetector' 和 'SurfDescriptorExtractor' -> 'SiftDescriptorExtractor')。
看来opencv的实现要差得多!检测到大量误报和更少的关键点!我尝试使用 sigma/contrastThreshold 等“SiftFeatureDetector”参数,但结果总是比原始大卫的版本差得多。
SIFT 的 opencv 实现与最初的 David Lowe 的实现有很大的不同吗?
有谁知道为“SiftFeatureDetector”设置了一个好的参数,以便 David 的实现(如 box.pgm/basmati.pgm ..)提供的对象图像的结果可能看起来与 David 的版本相似。
我正在学习图像处理,我正在尝试开始我的第一个项目,即图像中的简单数字识别。
到目前为止,我已经对图像应用了阈值处理。现在我想知道一些算法,我的系统可以通过这些算法识别图像中的数字。优选地,该算法必须简单,并且不必太鲁棒,因为我将使用相同的字体在绘画中生成图像。
我在这里查看了类似的问题,他们都指出使用库。记住我正在努力学习的人,所以请不要指出一些图书馆。
algorithm matlab image-processing image-recognition matlab-cvst
我有一个二进制斑点(见图),我想在其上放置一个已知宽度和高度的矩形。
如何找到最佳拟合矩形,即最大前景像素在内部且最大背景像素在外部的矩形?
(这是我对最适合的初步定义,我愿意接受其他建议)
我正在寻找已知尺寸的矩形,但如果有任意尺寸的解决方案,那就太好了。
斑点示例:

我想找到这些矩形:

到目前为止我的想法包括
我意识到对于符合我的标准的同一个斑点可能有多个矩形,理想情况下我想要一些可以找到所有候选者的算法(认为因为这可能更难,我很高兴有一种方法只找到一个候选者) :

我主要使用 opencv 和 cvBlobLib 来处理我的数据,但我对任何通用解决方案持开放态度。
algorithm opencv image-processing image-recognition object-recognition
任务:将人脸图像分类为女性或男性。可以使用带标签的训练图像,从网络摄像头获取测试图像。
使用: Python 2.7,OpenCV 2.4.4
我正在使用 ORB 从灰度图像中提取特征,我希望将其用于训练 K-最近邻分类器。每个训练图像都是不同的人,因此每个图像的关键点和描述符的数量明显不同。我的问题是我无法理解 KNN 和 ORB 的 OpenCV 文档。我看过其他关于 ORB、KNN 和 FLANN 的 SO 问题,但它们并没有多大帮助。
ORB 给出的描述符的性质究竟是什么?它与通过BRIEF、SURF、SIFT等获得的描述符有何不同?
对于 KNN 中的每个训练样本,特征描述符似乎应该具有相同的大小。如何确保每个图像的描述符大小相同?更一般地说,特征应该以什么格式呈现给 KNN 以使用给定的数据和标签进行训练?数据应该是整数还是浮点数?可以是字符吗?
可以在此处找到训练数据。
我也在使用haarcascade_frontalface_alt.xml来自 opencv 的示例
现在 KNN 模型只提供了 10 张图像进行训练,以查看我的程序是否通过而没有错误,但没有。
这是我的代码:
import cv2
from numpy import float32 as np.float32
def chooseCascade():
# TODO: Option for diferent cascades
# HAAR Classifier for frontal face
_cascade = cv2.CascadeClassifier('haarcascade_frontalface_alt.xml')
return _cascade
def cropToObj(cascade,imageFile):
# Load as 1-channel grayscale image
image = …Run Code Online (Sandbox Code Playgroud) python opencv classification image-processing image-recognition
我想从相机扫描图像并将其与预加载的图像进行比较。我想识别扫描的图像。
示例:我将在我的应用程序中保存此图像,当我扫描此类图像时,我想识别它。

(来源:iconarchive.com)
在识别过程中,是否有任何库或 SDK 可以在不使用 Internet 的情况下实现上述功能?
我已经尝试过使用opencv,但我没有得到有希望的结果和性能。我也不介意使用任何付费 SDK。
注意: 我想在用户没有互联网时实现它。一切都应该在离线模式下工作。
对于我的学士论文,我必须制作一个识别徽标的应用程序,例如:我看到汽车的徽标,我想找出它是什么车。我拍了一张汽车标志的照片,应用程序应该可以识别图像并将“梅赛德斯”这个词发回给我,以便我可以在线搜索有关汽车的信息。我希望无论标志的位置、光线或颜色如何,应用程序都能识别该标志代表什么。
我已经尝试过使用识别.im API,但它不能很好地工作,因为它是为比较而不是分类进行了校准和调整,而且我绝对需要分类。
我想使用云端识别,但在设备上也可以使用(在这种情况下我应该使用什么算法?)。
非常感谢
是否可以使用 Vision Framework 检测视频中的图像?此示例https://github.com/jeffreybergier/Blog-Getting-Started-with-Vision显示了如何跟踪用户先前点击的视频上的对象。是否可以将图像添加到项目中并检测此图像是否出现在视频中?我正在研究VNTargetedImageRequest但它是抽象类,谷歌返回了 4 个关于它的结果。
我正在尝试使用 Pytorch 对猫和狗的图像数据集进行分类。在我的代码中,到目前为止,我正在下载数据并进入文件夹 train,其中有两个文件夹,称为“cats”和“dogs”。然后我试图将这些数据加载到数据加载器中并通过批处理进行迭代,但它给了我一些我在迭代步骤中不明白的错误。
由于它是 Google Colab,我在那里有用于下载数据和安装库的代码。到目前为止,对我的代码的任何其他建议也将不胜感激。
!pip install torch
!pip install torchvision
from __future__ import print_function, division
import os
import torch
import pandas as pd
import numpy as np
# For showing and formatting images
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
# For importing datasets into pytorch
import torchvision.datasets as dataset
# Used for dataloaders
import torch.utils.data as data
# For pretrained resnet34 model
import torchvision.models as models
# For optimisation function
import torch.nn as nn
import …Run Code Online (Sandbox Code Playgroud) 如果标题不清楚,假设我有一个图像列表(10k+),并且我有一个我正在搜索的目标图像。
这是目标图像的示例:
这是我想要搜索以找到“相似”内容(ex1、ex2 和 ex3)的图像示例:
这是我做的匹配(我使用 KAZE)
from matplotlib import pyplot as plt
import numpy as np
import cv2
from typing import List
import os
import imutils
def calculate_matches(des1: List[cv2.KeyPoint], des2: List[cv2.KeyPoint]):
"""
does a matching algorithm to match if keypoints 1 and 2 are similar
@param des1: a numpy array of floats that are the descriptors of the keypoints
@param des2: a numpy array of floats that are the descriptors of the keypoints
@return:
"""
# bf matcher with …Run Code Online (Sandbox Code Playgroud) python opencv machine-learning image-processing image-recognition