标签: image-recognition

使用无专利描述符进行特征检测

我需要特征检测算法.我厌倦了在网上冲浪,除了SURF示例之外什么都没有,并提示如何做到这一点,但我没有找到除SIFT或SURF等专利描述之外的例子.

任何人都可以写使用的一个例子自由特征检测算法(如ORB/BRISK [据我理解SURF和FLAAN是非游离 ])？

我正在使用OpenCV 3.0.0.

algorithm opencv image-recognition feature-detection opencv3.0

den*_*631

2017 09-27

11
推荐指数

1
解决办法

8520
查看次数

使用TensorFlow进行图像识别

我是TensorFlow的新手,我正在寻找有关图像识别的帮助.是否有一个示例展示如何使用TensorFlow训练您自己的数字图像进行图像识别,如TensorFlow图像识别教程中使用的图像网模型

我查看了CIFAR-10模型培训,但它似乎没有提供培训您自己的图像的示例.

python image-recognition tensorflow

Phi*_*kpe

lucky-day

11
推荐指数

1
解决办法

2万
查看次数

如何提高在MNIST上训练的模型的数字识别能力？

我正在使用进行手印多位数识别Java，使用OpenCV库进行预处理和分割，并使用KerasMNIST训练的模型（精度为0.98）进行识别。

除了一件事之外，这种识别似乎效果很好。网络经常无法识别那些（数字“一”）。我不知道这是否是由于分割的预处理/不正确的实现而发生的，还是在标准MNIST上训练的网络只是没有看到看起来像我的测试用例的第一名。

这是经过预处理和分割后出现问题的数字的样子：

变成并分类为4。

变成并分类为7。

变成并分类为4。等等...

通过改进细分过程，可以解决此问题吗？还是通过增强培训设置？

编辑：增强训练集（数据扩充）肯定会有所帮助，这已经在我测试中，正确预处理的问题仍然存在。

我的预处理包括调整大小，转换为灰度，二值化，反转和膨胀。这是代码：

Mat resized = new Mat();
Imgproc.resize(image, resized, new Size(), 8, 8, Imgproc.INTER_CUBIC);

Mat grayscale = new Mat();
Imgproc.cvtColor(resized, grayscale, Imgproc.COLOR_BGR2GRAY);

Mat binImg = new Mat(grayscale.size(), CvType.CV_8U);
Imgproc.threshold(grayscale, binImg, 0, 255, Imgproc.THRESH_OTSU);

Mat inverted = new Mat();
Core.bitwise_not(binImg, inverted);

Mat dilated = new Mat(inverted.size(), CvType.CV_8U);
int dilation_size = 5;
Mat kernel = Imgproc.getStructuringElement(Imgproc.CV_SHAPE_CROSS, new Size(dilation_size, dilation_size));
Imgproc.dilate(inverted, …

Run Code Online (Sandbox Code Playgroud)

java opencv machine-learning image-recognition mnist

you*_*nda

2019 10-18

11
推荐指数

3
解决办法

284
查看次数

所以我希望能够识别图像中的模式(例如4号),我一直在阅读不同的算法,我真的想使用最近邻算法,它看起来很简单,我基于这个教程理解它:http: //people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html 问题是,虽然我知道如何使用它填补缺失的数据集,但我不明白我怎么能用它作为一种瞄准图像形状识别的模式识别工具.有人可以说明这个算法如何用于模式识别？我已经看过使用OpenCV的教程,但是我真的不想使用这个库,因为我有能力自己进行预处理,而且为了应该是一个简单的最近邻居而实现这个库似乎很愚蠢算法.

ocr image-recognition knn

use*_*895

2013 10-22

10
推荐指数

1
解决办法

9567
查看次数

使用Haskell检索图像的像素值

是否有可用的方法或库可以加载图像(jpeg,png等)并将该图像的像素值分配到列表或矩阵中？我想做一些图像和模式识别的实验.

在正确的方向稍微推动将不胜感激.

haskell image-processing image-recognition libraries

sub*_*ray

2016 04-17

10
推荐指数

1
解决办法

1668
查看次数

超平面之间的距离

我正在尝试自学一些机器学习,并且一直在使用MNIST数据库(http://yann.lecun.com/exdb/mnist/)这样做.该网站的作者在98年写了一篇关于所有不同类型的手写识别技术的论文,可在http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf上找到.

提到的第10种方法是"切线距离分类器".这个想法是,如果你将每个图像放在一个(NxM)维向量空间中,你可以计算两个图像之间的距离,作为超平面之间的距离,每个超平面是通过取点来给出超平面,并旋转图像,重新缩放图像,翻译图像等.

我想不出足以填补遗漏的细节.我知道其中大多数都是线性算子,那么如何使用这个事实来创建超平面呢？一旦我们有了超平面,我们如何与其他超平面保持距离？

math classification machine-learning image-processing image-recognition

mic*_*ard

2012 11-13

10
推荐指数

1
解决办法

1838
查看次数