我需要特征检测算法.我厌倦了在网上冲浪,除了SURF示例之外什么都没有,并提示如何做到这一点,但我没有找到除SIFT或SURF等专利描述之外的例子.
任何人都可以写使用的一个例子自由特征检测算法(如ORB/BRISK [据我理解SURF和FLAAN是非游离 ])?
我正在使用OpenCV 3.0.0.
algorithm opencv image-recognition feature-detection opencv3.0
我是TensorFlow的新手,我正在寻找有关图像识别的帮助.是否有一个示例展示如何使用TensorFlow训练您自己的数字图像进行图像识别,如TensorFlow图像识别教程中使用的图像网模型
我查看了CIFAR-10模型培训,但它似乎没有提供培训您自己的图像的示例.
我正在使用进行手印多位数识别Java,使用OpenCV库进行预处理和分割,并使用KerasMNIST训练的模型(精度为0.98)进行识别。
除了一件事之外,这种识别似乎效果很好。网络经常无法识别那些(数字“一”)。我不知道这是否是由于分割的预处理/不正确的实现而发生的,还是在标准MNIST上训练的网络只是没有看到看起来像我的测试用例的第一名。
这是经过预处理和分割后出现问题的数字的样子:
通过改进细分过程,可以解决此问题吗?还是通过增强培训设置?
编辑:增强训练集(数据扩充)肯定会有所帮助,这已经在我测试中,正确预处理的问题仍然存在。
我的预处理包括调整大小,转换为灰度,二值化,反转和膨胀。这是代码:
Mat resized = new Mat();
Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC);
Mat grayscale = new Mat();
Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY);
Mat binImg = new Mat(grayscale.size(), CvType.CV_8U);
Imgproc.threshold(grayscale, binImg, 0, 255, Imgproc.THRESH_OTSU);
Mat inverted = new Mat();
Core.bitwise_not(binImg, inverted);
Mat dilated = new Mat(inverted.size(), CvType.CV_8U);
int dilation_size = 5;
Mat kernel = Imgproc.getStructuringElement(Imgproc.CV_SHAPE_CROSS, new Size(dilation_size, dilation_size));
Imgproc.dilate(inverted, …Run Code Online (Sandbox Code Playgroud) 所以我希望能够识别图像中的模式(例如4号),我一直在阅读不同的算法,我真的想使用最近邻算法,它看起来很简单,我基于这个教程理解它:http: //people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html 问题是,虽然我知道如何使用它填补缺失的数据集,但我不明白我怎么能用它作为一种瞄准图像形状识别的模式识别工具.有人可以说明这个算法如何用于模式识别?我已经看过使用OpenCV的教程,但是我真的不想使用这个库,因为我有能力自己进行预处理,而且为了应该是一个简单的最近邻居而实现这个库似乎很愚蠢算法.
是否有可用的方法或库可以加载图像(jpeg,png等)并将该图像的像素值分配到列表或矩阵中?我想做一些图像和模式识别的实验.
在正确的方向稍微推动将不胜感激.
我正在尝试自学一些机器学习,并且一直在使用MNIST数据库(http://yann.lecun.com/exdb/mnist/)这样做.该网站的作者在98年写了一篇关于所有不同类型的手写识别技术的论文,可在http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf上找到.
提到的第10种方法是"切线距离分类器".这个想法是,如果你将每个图像放在一个(NxM)维向量空间中,你可以计算两个图像之间的距离,作为超平面之间的距离,每个超平面是通过取点来给出超平面,并旋转图像,重新缩放图像,翻译图像等.
我想不出足以填补遗漏的细节.我知道其中大多数都是线性算子,那么如何使用这个事实来创建超平面呢?一旦我们有了超平面,我们如何与其他超平面保持距离?
math classification machine-learning image-processing image-recognition
我的目标是在Tensorflow Inception附带的现有1000个Imagenet类中"添加"更多类.现在我可以通过从头开始训练来重新运行整个事情,bazel-bin/inception/imagenet_train但这需要很长时间,特别是每次我想添加一个新类.
是否可以使用bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/flower_photos,然后添加到现有的标签输出文件?
对不起,我是新手.
我参加了Coursera ML课程,我刚开始学习神经网络.
让我真正神秘化的一件事是,一旦你找到线性组合的好权重,识别某些东西,如手写数字,变得容易.
当你明白通过为线性组合找到一些非常好的参数,并将它们组合在一起并将它们相互馈送时,可以识别出看似抽象的东西(如汽车),这甚至更加疯狂.
线性组合的组合比我曾经想象的更具表现力.
这让我想知道是否有可能可视化NN的决策过程,至少在简单的情况下如此.
例如,如果我的输入是20x20灰度图像(即总共400个特征)并且输出是对应于识别数字的10个类别之一,我希望看到某种线性组合的级联导致NN到其的一种视觉解释结论.

我天真地想象这可以作为被识别图像的视觉提示来实现,可能是显示"影响决策最多的像素"的温度图,或者有助于理解神经网络在特定情况下如何工作的任何东西.
有没有一些神经网络演示呢?
language-agnostic ocr machine-learning image-recognition neural-network
我是iOS开发的新手,我正在尝试创建一个应用程序,使用iPhone的相机识别一串数字并将其转换为文本.
是否有可以轻松整合到我的应用程序中的iOS开发模块?或者是否有一个通用模块,我可以尝试移植iOS?
当然,免费模块更好.
提前致谢 :)
编辑:要删除暂停主持人提出这个问题,我已经提出以下要求:
iphone image-processing image-recognition text-recognition ios
我是TensorFlow的新手.
实际上,我正在TensorFlow网站上测试一些分类的例子"卷积神经网络",它解释了如何将输入图像分类为预定义的类,但问题是:我无法弄清楚如何检测多个对象相同的形象.例如,我有一个带有猫和狗的输入图像,我希望我的图形在输出中显示它们都是图像中的"猫和狗".