训练算法以获得更好的图像识别

Question

这是一个研究问题而不是直接的编程问题.

我正在研究一种符号识别算法,该软件目前的功能是什么,它采用图像,将其划分为轮廓(blob)并开始将每个轮廓与预定义模板列表进行匹配.然后对于每个轮廓,它采用具有最高匹配率的那个.

算法很公平,但我需要更好地训练它.我的意思是:我想使用机器学习算法来训练算法以获得更好的匹配.让我们举一个例子:

我在符号上运行识别,算法将运行并发现此符号是汽车,然后我必须确认该结果(可能通过单击"是"或"否")算法应该从中学习.因此,如果我点击否,算法应该知道这不是汽车,并且下次会有更好的结果(也许尝试匹配其他东西).如果我点击"是",他就会知道他是正确的,下次他在搜索汽车时表现更好.

这是我试图研究的概念.我需要能够实现这类目标的文档或算法.我不是在寻找实现或编程,只是概念或研究.

我已经做了很多研究,并且阅读了很多关于机器学习,神经网络,决策树的内容....但是我无法知道如何在我的场景中使用任何东西.

我希望我很清楚,这种类型的问题在堆栈溢出时是允许的.如果不是我很抱歉

非常感谢任何帮助或提示

Answer 1

图像识别仍然是社区的挑战.您在手动单击是/否的过程中所描述的只是创建标记数据.由于这是一个非常广泛的领域,我将只指出一些可能有用的链接.

首先,您可能希望使用一些现有的图像数据库,而不是创建自己的图像数据库,这可以节省您的大量精力.例如,UCIC图像db中的这个汽车数据集.
由于您已具备机器学习的背景,因此您可以查看一些与您的项目兴趣完全匹配的调查文件,例如搜索object recognition survey paper或feature extraction car谷歌.
然后你可以深入研究一些好的论文,看看它们是否适合你的项目.例如,您可以查看下面与UCIC图像db链接的两篇论文.
- Shivani Agarwal,Aatif Awan和Dan Roth,学习通过稀疏的,基于部分的表示来检测图像中的对象.IEEE Transactions on Pattern Analysis and Machine Intelligence,26(11):1475-1490,2004.
- Shivani Agarwal和Dan Roth,学习物体检测的稀疏表示."第七届欧洲计算机视觉会议论文集",第四部分,第113-130页,丹麦哥本哈根,2002年.
还要检查一些实现的软件,而不是从头开始,在你的情况下,opencv应该是一个很好的开始.
对于图像识别,特征提取是最重要的步骤之一.您可能想要检查社区中的一些最先进的算法.(SIFT,均值漂移,harr特征等).
当您到达分类步骤时,Boosting算法可能也很有用.我看到很多学者在图像识别界提到这一点.
正如@nickbar建议的那样,请访问https://stats.stackexchange.com/进行更多讨论