标签: computer-vision

有什么方法可以在二值图像中获得更平滑的形状吗?

我想在颜色分割后检测二值图像中的三角形、圆形和矩形等形状,但有时形状非常撕裂和参差不齐,如图所示。有没有什么办法可以让身材变得更好呢?

也许我的彩色蒙版有问题。

    def redColorDetection(self, img):

    self.low_red = np.array([160, 50, 5])
    self.high_red = np.array([180, 255, 255])

    red_mask = cv2.inRange(self.hsv, self.low_red, self.high_red)

    return  red_mask
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

在此输入图像描述

python opencv image-processing computer-vision

0
推荐指数
2
解决办法
213
查看次数

如何检测图片上颜色相同的区域?

我正在尝试使用OpenCv进行"人数统计".我的摄像头安装在天花板上,俯视着.现在我有问题检测头部.我已阅读http://pdfcast.org/pdf/real-time-people-couting ; 我正在尝试进行颜色分割,找到颜色相同的椭圆区域并将其称为"人头".但我不知道如何进行颜色分割.
在这里我从纸上显示我想要的图片
http://smotr.im/7LDz
请帮帮我,谢谢.

opencv computer-vision visual-c++

-1
推荐指数
1
解决办法
205
查看次数

从图像中的统一背景中提取页面

如果我有一张图像,其中有一页文字在均匀背景上拍摄,我该如何自动检测纸张和背景之间的边界?

我想要检测的图像示例如下所示.我将要处理的图像由统一背景上的单个页面组成,它们可以以任何角度旋转.

在此输入图像描述

matlab image image-processing computer-vision

-1
推荐指数
1
解决办法
382
查看次数

如何检测颠倒的脸?

我想检测直立和颠倒的面部,但是在倒置的图像中无法识别面部.

我在Python中使用了dlib库shape_predictor_68_face_landmarks.dat.

是否有一个可以识别正面和颠倒面孔的图书馆?

python opencv computer-vision face-detection dlib

-1
推荐指数
1
解决办法
219
查看次数

OpenCV2 imwrite is writing a black image

I am messing around with opencv2 for neural style transfer... In cv2.imshow("Output", output), I am able to say my picture. But when I write output to file with cv2.imwrite("my_file.jpg", output). Is it because my file extension is wrong? When I do like cv2.imwrite("my_file.jpg", input) though, it does show my original input picture. Any ideas? Thank you in advance.

# import the necessary packages
from __future__ import print_function
import argparse

import time
import cv2
import imutils

import numpy as np
from …
Run Code Online (Sandbox Code Playgroud)

opencv machine-learning computer-vision

-1
推荐指数
1
解决办法
680
查看次数

Pytorch for Dummies 中的卷积自编码器

我在这里问一些关于 Pytorch 和卷积自动编码器的更一般的问题。

  1. 如果我只使用卷积层 (FCN),我什至需要关心输入形状吗?然后我如何最好地选择特征图的数量?
  2. ConvTranspose2d 层会自动解除池化吗?
  3. 您能在我的示例中发现任何错误或非常规代码吗?

顺便说一句,我想制作一个对称的卷积自动编码器来对不同图像大小的黑白图像进行着色。

    self.encoder = nn.Sequential (
        # conv 1
        nn.Conv2d(in_channels=3, out_channels=512, kernel_size=3, stride=1, padding=1),
        nn.ReLU,
        nn.MaxPool2d(kernel_size=2, stride=2),  # 1/2
        nn.BatchNorm2d(512),

        # conv 2
        nn.Conv2d(in_channels=512, out_channels=256, kernel_size=3, stride=1, padding=1),
        nn.ReLU,
        nn.MaxPool2d(kernel_size=2, stride=2),  # 1/4
        nn.BatchNorm2d(256),

        # conv 3
        nn.Conv2d(in_channels=256, out_channels=128, kernel_size=3, stride=1, padding=1),
        nn.ReLU,
        nn.MaxPool2d(kernel_size=2, stride=2),  # 1/8
        nn.BatchNorm2d(128),

        # conv 4
        nn.Conv2d(in_channels=128, out_channels=64, kernel_size=3, stride=1, padding=1),
        nn.ReLU,
        nn.MaxPool2d(kernel_size=2, stride=2),  #1/16
        nn.BatchNorm2d(64)
    )


    self.encoder = nn.Sequential (
        # conv 5
        nn.ConvTranspose2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, …
Run Code Online (Sandbox Code Playgroud)

machine-learning computer-vision neural-network deep-learning pytorch

-1
推荐指数
1
解决办法
1886
查看次数

挑战:如何获得面积最小的 4 边形

我正在尝试获取图像中的四个坐标,以便可以对其应用透视变换。我需要一个四边多边形,它不会裁剪图像中的任何内容并覆盖最小区域。我尝试了一些像“minAreaRect()”这样的函数,但它给出了最小面积矩形,而不是使用四边多边形的可能最小面积。为了您的理解,我提供测试图像。 测试图像 -> 将内容与四边形多边形绑定,但不应丢失任何内容

我可以使用轮廓和 minAreaRect() 函数在其上绘制一个矩形,但这并不是使用四个边获得最小面积的最佳选择。我坚信,有任何可能的方法可以让我们在其上绘制一个四边多边形,以最小的面积覆盖图像上存在的所有内容。

谢谢...

python ocr opencv computer-vision python-3.x

-1
推荐指数
1
解决办法
957
查看次数

使用 Python 查找图像中两点之间的物理距离

我有图像的两个坐标 (x, y)

Point N: (x = 2314, y = 751), Width = 2880, Hight = 2304
Point S: (x = 1533, y = 670), Width = 2880, Hight = 2304
Run Code Online (Sandbox Code Playgroud)

当我在 matplotlib 中绘制它们时,它们看起来像这样。(尽管我也在这里绘制了其他一些点。) -

(尽管我也在这里绘制了其他一些点。) -

现在,我想计算S and N 我知道的 X 射线板和 X 射线机器之间的距离是 180 厘米。

我已经尝试过使用该math功能。

distance = math.sqrt( ((N[0]-S[0])**2)+((N[1]-S[1])**2) )
print(distance)
Run Code Online (Sandbox Code Playgroud)

这给了我这样的结果 755.2747844327918

但我需要知道距离(以米为单位)。我怎样才能以某种方式做到这一点?

python math geometry image-processing computer-vision

-1
推荐指数
1
解决办法
480
查看次数

为什么在64位操作系统中,32位操作系统的4GB内存不等于2GB?

据我所知,"32位"等于2 ^ 32,这意味着我可以用32位操作系统定义4GB的内存.并且"64位"是2 ^ 64,允许15EB.因此,使用64位操作系统,我们可以在计算机中放入更多内存.

但是,我对另一点感到困惑.

我们可以在32位的情况下看到我们在系统中有(比方说)4GB的物理内存,我们将4GB除以32位整数的大小,我们可以存储一些整数(称为N)记忆.并且,在64位中,计算是4GB除以64位整数的大小,因此我们只能存储一半的整数.结果,对于64位,我们无法存储具有相同内存的整数.

这是否意味着微软通过在32位和64位版本的操作系统中将此内存显示为"4GB"来欺骗我们?

architecture computer-architecture computer-vision 32bit-64bit

-2
推荐指数
1
解决办法
861
查看次数

如何识别图像中的金色?

我有一个关于硬币识别的作业。我国的硬币有两种颜色:金色和银色。我如何识别金色?

我已经从由几个硬币组成的图像中裁剪了每个硬币。我想知道如何识别金币。

我的讲师建议:

  • 将 RGB 转换为 HSI
  • 获取裁剪后的硬币图像的色调和饱和度值
  • 如果它的色相和饱和度值在黄金的色相和饱和度范围内,那就是金币。

我的方法如下:

  1. 增强图像,使颜色可见。
  2. 识别每个硬币并裁剪它们
  3. 确定它们的颜色并将它们分成两组:银色和金色。
  4. 通过从每种颜色制作一枚硬币作为参考来确定它们的价值,然后与具有参考硬币的另一枚硬币进行比较(基于比率)。

我已经完成了第 1 步和第 2 步,但我被困在了第三步。我不知道如何区分金色和银色硬币。我应该使用哪种方法在 MATLAB 中区分它们?

硬币的照片

matlab image colors image-processing computer-vision

-2
推荐指数
1
解决办法
975
查看次数