相关疑难解决方法(0)

简单快速的方法来比较图像的相似性

我需要一种简单快速的方法来比较两个图像的相似性.即如果它们包含完全相同的东西但是可能有一些稍微不同的背景并且可能被移动/调整大小几个像素,我想获得高值.

(更具体的是,如果重要的话:一张图片是一个图标,另一张图片是截图的子区域,我想知道该子区域是否恰好是图标.)

我手边有OpenCV,但我仍然不习惯它.

到目前为止我想到的一种可能性:将两张图片分成10x10个单元格,对于这100个单元格中的每一个,比较颜色直方图.然后我可以设置一些补偿阈值,如果我得到的值高于该阈值,我认为它们是相似的.

我还没有尝试过它的效果如何,但我想它会足够好.图像已经非常相似(在我的用例中),所以我可以使用相当高的阈值.

我想有很多其他可能的解决方案可以或多或少地工作(因为任务本身非常简单,因为我只想检测相似性,如果它们非常相似).你会建议什么?


关于从图像中获取签名/指纹/哈希,有一些非常相关/类似的问题:

另外,我偶然发现了这些具有获取指纹功能的实现:

关于感知图像哈希的一些讨论:这里


有点offtopic:有很多方法来创建音频指纹.MusicBrainz是一种为歌曲提供基于指纹的查找的网络服务,在他们的维基中很好的概述.他们现在正在使用AcoustID.这是为了找到精确(或大部分精确)的匹配.要查找类似的匹配(或者如果您只有一些片段或高噪音),请查看Echoprint.一个相关的SO问题在这里.所以这似乎解决了音频问题.所有这些解决方案都非常有效.

对一般的模糊搜索一个稍微更通用的问题是在这里.例如,存在局部敏感的散列最近邻搜索.

opencv image-processing computer-vision

186
推荐指数
5
解决办法
12万
查看次数

图像中的标识识别

有没有人知道最近在图像中识别标识的学术工作?请仅在您熟悉此特定主题时回答(我可以在Google上搜索"徽标识别",非常感谢您).任何对计算机视觉有所了解并且已完成物体识别工作的人也欢迎发表评论.

更新:请参考算法方面(您认为合适的方法,本领域的论文,是否应该对现实世界数据(效率考虑)起作用(并且已经过测试)而不是技术方面(使用的编程语言或是否与OpenCV ...)图像索引和基于内容的图像检索的工作也可以帮助.

machine-learning image-recognition computer-vision

57
推荐指数
3
解决办法
4万
查看次数

需要一个好的算法来分类8GB的图片

我有大约150,000张照片,其中一些是重复的.我认为SSIM算法是比较两张图片并查看它们是否重复的不错选择.但是,如果我想以这种方式找到重复,我将不得不比较150.000*149.999图片,这将永远.

所以我现在正在寻找的是一种快速有效的算法,可以为每张图片创建平均值,然后只比较接近其平均值的图像.

简而言之:我正在寻找一种有效的图片分类方法!

我打算使用C++ CImg库来完成这项任务,因为它很快.

谢谢!

c++ jpeg image cimg

8
推荐指数
1
解决办法
520
查看次数

OpenCv/C++ - 轻松地从具有大型数据库的图片中查找相似之处

我想从查询与数据库中的图片(约2000)进行比较.

在本网站发帖之前,我阅读了很多关于在大型数据库中匹配图片的方法的文章,并阅读了stackOverflow上的很多帖子.

关于论文,有一些有趣的东西,但技术性很强,很难理解算法.(我刚开始专注于这个领域)

帖子(最有趣的):

简单快速的方法来比较图像的相似性 ;

高维数据中最近的邻居?;

如何理解局部敏感哈希?;

图像指纹比较多个图像的相似度 ;

C++/SIFT/SQL - 如果有一种方法可以有效地比较图像的SIFT描述符和SQL数据库中的SIFT描述符?

论文:

具有大型词汇表和快速空间匹配的对象检索,

图像相似性搜索紧凑数据结构,

LSH,

近重复图像检测min-Hash和tf-idf加权

词汇树

聚合本地描述符

但我仍然困惑.

我做的第一件事就是实施BoW.我训练了Bag of Words(使用ORB作为探测器和描述符,并使用了VLAD功能)和5级,以测试其效率.经过长时间的培训,我推出了它.它运行良好,准确率为94%.那很不错.

但是我有一个问题:

  • 我不想做分类.在我的数据库中,我将有大约2000张不同的图片.我只是想找到我的查询和数据库之间的最佳匹配.因此,如果我有2000张不同的图片,如果我合乎逻辑我必须考虑这些2000张图片作为2000年的不同类,显然这是不可能的......

首先,你同意我的意见吗?这显然是做我想做的最好的方法吗?也许还有另一种方法可以使用BoW来查找数据库中的相似之处?

我做的第二件事是"更简单".我计算查询的描述符.然后我在我的所有数据库上做了一个循环,我计算了每个图片的描述符,然后在向量中添加了每个描述符.

std::vector<cv::Mat> all_descriptors_database;
for (i ? 2000) :
    cv::Mat request=cv::imread(img);
    computeKeypoints(request) ;
    computeDescriptors(request) ;
    all_descriptors_database.pushback(descriptors_of_request)
Run Code Online (Sandbox Code Playgroud)

最后,我有一个大向量,其中包含所有数据库的所有描述符.(所有关键点都一样)

然后,这就是我感到困惑的地方.开始时,我想计算循环内部的匹配,也就是说,对于数据库中的每个图像,计算其描述符并与查询匹配.但是花了很多时间.

因此,在阅读了大量关于如何在大数据库中找到相似之处的论文后,我发现LSH算法似乎适合于那种搜索.

因此我想使用这种方法.所以在我的循环中我做了类似的事情:

//Create Flann LSH index
cv::flann::Index flannIndex(all_descriptors_database.at(i), cv::flann::LshIndexParams(12, 20, 2), cvflann::FLANN_DIST_HAMMING);
        cv::Mat results, dists;
        int k=2; // find the 2 nearest neighbors
        // search (nearest neighbor)
        flannIndex.knnSearch(query_descriptors, results, …
Run Code Online (Sandbox Code Playgroud)

c++ mysql opencv

7
推荐指数
1
解决办法
2750
查看次数