我想创建一个在工厂中使用的系统来测量从装配线上下来的物体的尺寸.物体是石板,大致长方形,我喜欢宽度和高度.每块石头都用闪光灯拍摄在同一位置,因此条件非常可控.棘手的部分是石头表面有时会有图案(通常是带有涟漪和条纹的大理石),它们有时几乎是黑色的,与阴影融为一体.
我尝试从背景的参考图像中简单地减去每个图像,但是在光线和滚轮的位置以及输出真正有噪声的机器的位置上有足够小的变化.
我计划接下来尝试的方法是使用Canny的边缘检测算法,然后使用某种数值优化(可能是Nelder-Mead)将4边多边形与边缘匹配.然而,在我回家酿造之前,是否存在一种在这种情况下运作良好的现有方法?
如果它有所帮助,就可以使用已知在平板内的图像补丁(它们总是排列在角落中)来"种子化"算法,以帮助识别其表面图案和颜色.如有必要,我还可以制作一套带注释图像的训练集.
一些样本背景图像和一些石板:

machine-learning computer-vision object-recognition image-segmentation
我最近实施以下描述的技术识别软件本文.但是,我的数据集还包含使用OpenNI拍摄的深度图.
我想使用深度信息来增强识别器的稳健性.我虽然在提取VFH描述符后训练了1-vs-all SVM计算弓形响应直方图(我为此任务改编了OpenCV DescriptorExtractor接口).但重点是:我如何将两者结合起来以获得更精确的结果?有人可以建议我这个策略吗?
Ps我非常想测试识别器直接向kinect显示对象(而不是像我现在正在做的那样,将裁剪的图像提供给识别器).
我有一个二进制斑点(见图),我想在其上放置一个已知宽度和高度的矩形。
如何找到最佳拟合矩形,即最大前景像素在内部且最大背景像素在外部的矩形?
(这是我对最适合的初步定义,我愿意接受其他建议)
我正在寻找已知尺寸的矩形,但如果有任意尺寸的解决方案,那就太好了。
斑点示例:

我想找到这些矩形:

到目前为止我的想法包括
我意识到对于符合我的标准的同一个斑点可能有多个矩形,理想情况下我想要一些可以找到所有候选者的算法(认为因为这可能更难,我很高兴有一种方法只找到一个候选者) :

我主要使用 opencv 和 cvBlobLib 来处理我的数据,但我对任何通用解决方案持开放态度。
algorithm opencv image-processing image-recognition object-recognition
我对物体识别和物体检测之间存在轻微的混淆.有人说物体检测是物体识别的一个子话题?有人可以澄清这两个主题之间的区别吗?
尽我所知.
对象识别正在回答"图像中的对象是什么"这一问题.然而,对象检测正在回答"该对象在哪里"的问题?
希望有人能够通过慷慨地为每个人提供一个例子来说明差异
image-processing object-detection computer-vision object-recognition
我用FFmpeg这个命令在视频上叠加图像/表情符号 -
"-i "+inputfilePath+" -filter_complex "+"[0][1]overlay=enable='between(t,"+startTime+","+endTime+")'[v1]"+" -map [v0] -map 0:a "+OutputfilePath;
Run Code Online (Sandbox Code Playgroud)
但是上面的命令只覆盖视频上的图像并保持静止.
在Instagram和Snapchat中有新的引脚功能.我想完全相同,例如blur在移动的脸上或在视频下方 -
这是链接.
是否有可能通过FFmpeg?
我认为拥有OPENCV或Argumented Reality知识的人可以为此提供帮助.它与AR类似,因为我们需要在视频/实时摄像头上准确移动/缩放表情符号.
我不知道这是否是问这个问题的正确 stackexchange 论坛,如果不是这种情况,请告诉我。
我正在开发一个应用程序,该应用程序将包含一幅画的输入图像作为输入,它能够告诉您这幅画的标题。一个类似的情况是:给定一个包含建筑物的输入图像,返回的结果是建筑物的名称。
这是一款什么样的应用?在第一次影响时,我会说“图像分类”之类的东西。我不是计算机视觉专家,但我一直认为“图像分类”类似于“给定图像,告诉我该图像中包含什么”。
另一方面,对象检测定义似乎与识别类的对象(例如建筑物)而不是类本身的实例(例如长城)更相关:
对象检测是一种与计算机视觉和图像处理相关的计算机技术,用于检测数字图像和视频中某个类别(例如人类、建筑物或汽车)的语义对象的实例。
关于物体识别:
物体识别是感知物体物理属性(如形状、颜色和纹理)并将语义属性应用于它(如将物体识别为苹果)的能力。
我真的不知道如何对我所描述的应用程序进行分类(真是个笑话……)。你怎么认为?
classification object-detection computer-vision object-recognition
直观地说,似乎从几乎任何物体的不同角度给出十几个2D图像,应该很容易构造该对象的三维表示.随后,以这种方式获得的3d表示库可用于识别新的2d图像.
沿着这些方向有哪些文献,为什么它还没有产生强烈的物体识别?
graphics computer-vision object-recognition 3d-reconstruction
我最近开始在图像处理领域开展一个小型的业余爱好者计划,我有点像图像处理的菜鸟,但我想弄清楚它的至少某些方面.
我想要做的是通过颜色(最好是实时视频输入)将图像中的对象分开,然后识别它们的颜色.
我读了一些关于OpenCV以及一些不同算法的内容.我甚至开始使用canny算法进行一些工作,但我不确定这是我应该根据需要开始的算法,因为它检测对象的边缘而不管它们的颜色.
即使它是我应该使用的算法,识别它为我标记的对象的颜色的最佳方法是什么?
我希望我做得足够清楚.
非常感谢!
我想识别并计算图片中的对象,例如计算社区图片中的房屋数量。使用 ML Kit 执行此操作的最佳方法是什么?
我需要使用对象检测 API吗?或者是否可以使用直接的图像标签获得多个“房屋”标签?
我正在学习OpenCV的基础知识,我认为一个好的项目可以帮助我让学习变得更有趣.在思考了一些想法之后,我想出了一些物质识别项目.比方说,我给自己做了一台输送机,它正在运输用于生产某种产品的材料(这个产品并不重要,所以).有3种材料,照明条件会有所不同(早上到下午使用自然光,晚上使用灯泡).这将是问题描述.
我正在考虑使用容易获得的沙子,木头和岩石.并将它们放在塑料表面上.在拍完照片之后,我将应用一些直方图来获得颜色,并使用这种颜色我将识别材料.但是,由于闪电条件会随着时间的推移而变化,当我拍摄这张照片并应用直方图时,颜色会发生变化,材料将无法正确识别.而且我想,如果我使用沙子和灰尘,他们有非常相似的颜色,但不同的质地,有什么东西可以帮助我吗?
我只是想要一些想法,也许该领域的一些专家可以指导我.