图像中的标识识别

eli*_*jah 57 machine-learning image-recognition computer-vision

有没有人知道最近在图像中识别标识的学术工作?请仅在您熟悉此特定主题时回答(我可以在Google上搜索"徽标识别",非常感谢您).任何对计算机视觉有所了解并且已完成物体识别工作的人也欢迎发表评论.

更新:请参考算法方面(您认为合适的方法,本领域的论文,是否应该对现实世界数据(效率考虑)起作用(并且已经过测试)而不是技术方面(使用的编程语言或是否与OpenCV ...)图像索引和基于内容的图像检索的工作也可以帮助.

Rom*_*lov 39

您可以尝试使用SIFT等本地功能:http: //en.wikipedia.org/wiki/Scale-invariant_feature_transform

它应该工作,因为徽标形状通常是不变的,因此提取的特征应该很好地匹配.

工作流程将如下所示:

  1. 检测角落(例如Harris角落探测器) - 对于Nike徽标,它们是两个锋利的末端.

  2. 计算描述符(如SIFT - 128D整数向量)

  3. 在训练阶段记住它们; 在匹配阶段找到训练期间获得的数据库中每个特征的最近邻居.最后,你有一组匹配(其中一些可能是错误的).

  4. 使用RANSAC播出错误的匹配.因此,您将获得描述从理想徽标图像转换到您找到徽标的图形的矩阵.根据设置,您可以允许不同类型的变换(只是平移;平移和旋转;仿射变换).

Szeliski的书中有关于局部特征的章节(4.1). http://research.microsoft.com/en-us/um/people/szeliski/Book/

PS

  1. 我以为你想在照片中找到标志,例如找到所有的百事可乐广告牌,所以它们可能会被扭曲.如果您需要在屏幕上找到电视频道徽标(这样就不会旋转和缩放),您可以更轻松地进行(模式匹配等).

  2. 传统的SIFT不考虑颜色信息.由于徽标通常具有恒定的颜色(尽管确切的颜色取决于闪电和相机),您可能需要以某种方式考虑颜色信息.


Ste*_*fan 31

我们在现实世界的图像中进行了徽标检测/识别.我们还创建了一个数据集FlickrLogos-32并将其公之于众,包括数据,地面实况和评估脚本.

在我们的工作中,我们将徽标识别视为检索问题,以简化多类识别,并允许此类系统轻松扩展到许多(例如数千)徽标类.

最近,我们开发了一种名为Bundle min-Hashing的捆绑技术,该技术将多个局部特征的空间配置聚合为高度独特的特征束.捆绑表示可用于检索和识别.请参阅以下示例热图以获取徽标检测:

在此输入图像描述 在此输入图像描述

您将找到有关内部操作的更多详细信息,该方法的潜在应用,其性能实验,当然还有许多参考文献[1] [2]中的相关工作.

  • 你可以在这里找到论文:http://www.multimedia-computing.de/wiki/Stefan_Romberg.寻找"Bundle min-Hashing"或我的博士论文.我有一些不公开的演示.原型已经售出. (3认同)

Mar*_*rco 7

研究过:体育视频数据库中的商标匹配和检索得到了论文的PDF:http://scholar.google.it/scholar?cluster = 9926471658203167449&hl = en&as_sdt = 2000

我们使用SIFT作为商标和图像描述符,并使用标准化阈值匹配来计算模型和图像之间的距离.在我们的最新工作中,我们已经能够使用元模型大大减少计算,创建评估存在于同一商标的不同版本中的SIFT点的相关性.

我会说,由于目前使用的电视标准的视觉质量非常糟糕,因此使用视频比使用照片更难.

马尔科