标签: computer-vision

如何将图像输入神经网络?

我理解神经网络是如何工作的,但如果我想将它们用于像实际字符识别这样的图像处理,我无法理解如何将图像数据输入神经网络.

我有一个非常大的A信件形象.也许我应该尝试从图像中获取一些信息/规格,然后使用该规范的值向量?它们将成为神经网络的输入?

谁已经做过这样的事情,你能解释一下如何做到这一点吗?

pattern-recognition image-processing computer-vision neural-network

33
推荐指数
2
解决办法
3万
查看次数

如何在Android增强现实中检测物理对象?

我找到了很多方法来检测不同的形状.但是当我去寻找物理对象时,运气不好.根据我的阅读,我们应该在图像周围有一个黑色边框来制作图案文件.如果我遵循这个概念并生成模式,那么我的应用程序会检测打印输出的图像.但在现实世界中,物体不一定在其周围具有黑色边框方形.

更新

虽然我接受了答案,但我的问题仍然没有解决.由于仍然没有检测物理对象的解决方案.

欢迎任何进一步的研究和链接!

android object-detection computer-vision augmented-reality

33
推荐指数
1
解决办法
1万
查看次数

使用OpenCV和Python比较图像的相似性

我正在尝试将图像与其他图像列表进行比较,并返回此列表中的一系列图像(如Google搜索图像),其相似度高达70%.

我在这篇文章中得到了这段代码,并根据我的上下文进

# Load the images
img =cv2.imread(MEDIA_ROOT + "/uploads/imagerecognize/armchair.jpg")

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.FeatureDetector_create("SURF")
surfDescriptorExtractor = cv2.DescriptorExtractor_create("SURF")
kp = surf.detect(imgg)
kp, descritors = surfDescriptorExtractor.compute(imgg,kp)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

# kNN training
knn = cv2.KNearest()
knn.train(samples,responses)

modelImages = [MEDIA_ROOT + "/uploads/imagerecognize/1.jpg", MEDIA_ROOT + "/uploads/imagerecognize/2.jpg", MEDIA_ROOT + "/uploads/imagerecognize/3.jpg"]

for modelImage in modelImages:

    # Now loading a template image and …
Run Code Online (Sandbox Code Playgroud)

python opencv computer-vision

33
推荐指数
4
解决办法
2万
查看次数

convert_imageset.cpp指南

我对机器学习/ python/ubuntu比较新.

我有一组.jpg格式的图像,其中一半包含我想要学习的功能,一半不需要.我找不到将它们转换为所需的lmdb格式的方法.

我有必要的文本输入文件.

我的问题是,任何人都可以提供有关如何convert_imageset.cpp在ubuntu终端中使用的分步指南吗?

谢谢

machine-learning image-processing computer-vision deep-learning caffe

33
推荐指数
1
解决办法
3万
查看次数

Pytorch RuntimeError:CUDA 内存不足且有大量可用内存

在训练模型时,我遇到了以下问题:

RuntimeError: CUDA out of memory. Tried to allocate 304.00 MiB (GPU 0; 8.00 GiB total capacity; 142.76 MiB already allocated; 6.32 GiB free; 158.00 MiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

正如我们所看到的,当尝试分配 304 MiB 内存时发生错误,而 6.32 GiB 是空闲的!问题是什么?正如我所看到的,建议的选项是设置 max_split_size_mb 以避免碎片。它会有帮助吗?如何正确地做到这一点?

这是我的 PyTorch 版本:

火炬==1.10.2+cu113

火炬视觉==0.11.3+cu113

火炬音频===0.10.2+cu113

python machine-learning computer-vision pytorch

33
推荐指数
2
解决办法
10万
查看次数

如何识别此图像中的矩形?

我有一个水平和垂直线条的图像.事实上,这张图片是BBC网站转换为横向和纵向的线条.我的问题是我希望能够找到图像中的所有矩形.我想写一个计算机程序来查找所有的矩形.有谁知道如何做到这一点或建议如何开始的想法?这个任务对我来说很容易找到视觉矩形,但我不知道如何将其描述为一个程序.

图片是BBC的网站http://www.bbc.co.uk/


更新到此,我编写了将BBC网站图像转换为水平和垂直线的代码,问题是这些线条在角落处并不完全相遇,有时它们并不完全形成矩形.谢谢!

graphics artificial-intelligence machine-learning computer-vision

31
推荐指数
2
解决办法
5万
查看次数

ASP.NET MVC中的QR代码生成

是否有生成QR代码的.NET API ?

微薄的人需要手机才能读取QR码. 哈哈哈.

我想在我希望用户打印出来的页面上显示这些内容.

.net asp.net-mvc qr-code barcode computer-vision

31
推荐指数
4
解决办法
4万
查看次数

开发Dilbert漫画图像分类算法的一般方法

作为一个自我发展练习,我想开发一个简单的分类算法,给定Dilbert卡通片的特定单元格,能够识别出动画片中存在哪些角色(Dilbert,PHB,Ratbert等).

我认为最好的方法是(1)将一些算法应用于图像,将其转换为一组特征,以及(2)使用训练集和许多可能的机器学习算法之一来关联存在/没有特定特征存在于细胞中的某些特征.

所以我的问题是 - (a)这是正确的方法,(b)因为有许多分类算法和ML算法要测试,找到合适的算法的好方法是什么,以及(c)你会开始哪种算法因为我们基本上是在对卡通进行分类练习.

python classification machine-learning computer-vision feature-detection

31
推荐指数
1
解决办法
7993
查看次数

是否存在用于尺度不变特征提取的SURF和SIFT的快速替代方案?

SURF和SIFT一样获得专利.ORB和BRIEF没有获得专利,但它们的特征不是规模不变的,严重限制了它们在复杂场景中的实用性.

是否有任何特征提取器能够像SURF一样快速地提取尺度不变的特征,并且不像SURF和SIFT那样严格获得专利?

opencv feature-extraction computer-vision feature-detection

31
推荐指数
4
解决办法
3万
查看次数

OpenCV模板匹配和透明度

OpenCV在模板匹配期间处理图像透明度的方式是什么?

问题是模板图像需要有透明的部分,因为在原始图像中,这些地方可能有任何东西.

我尝试了所有的方法,但没有一个产生积极的结果(例如原始图像中模板的位置未被正确检测到).

opencv image-processing computer-vision template-matching

30
推荐指数
3
解决办法
3万
查看次数