我想在颜色分割后检测二值图像中的三角形、圆形和矩形等形状,但有时形状非常撕裂和参差不齐,如图所示。有没有什么办法可以让身材变得更好呢?
也许我的彩色蒙版有问题。
def redColorDetection(self, img):
self.low_red = np.array([160, 50, 5])
self.high_red = np.array([180, 255, 255])
red_mask = cv2.inRange(self.hsv, self.low_red, self.high_red)
return red_mask
Run Code Online (Sandbox Code Playgroud)
我正在尝试使用OpenCv进行"人数统计".我的摄像头安装在天花板上,俯视着.现在我有问题检测头部.我已阅读http://pdfcast.org/pdf/real-time-people-couting ; 我正在尝试进行颜色分割,找到颜色相同的椭圆区域并将其称为"人头".但我不知道如何进行颜色分割.
在这里我从纸上显示我想要的图片
http://smotr.im/7LDz
请帮帮我,谢谢.
如果我有一张图像,其中有一页文字在均匀背景上拍摄,我该如何自动检测纸张和背景之间的边界?
我想要检测的图像示例如下所示.我将要处理的图像由统一背景上的单个页面组成,它们可以以任何角度旋转.

我想检测直立和颠倒的面部,但是在倒置的图像中无法识别面部.
我在Python中使用了dlib库shape_predictor_68_face_landmarks.dat.
是否有一个可以识别正面和颠倒面孔的图书馆?
I am messing around with opencv2 for neural style transfer... In cv2.imshow("Output", output), I am able to say my picture. But when I write output to file with cv2.imwrite("my_file.jpg", output). Is it because my file extension is wrong? When I do like cv2.imwrite("my_file.jpg", input) though, it does show my original input picture. Any ideas? Thank you in advance.
# import the necessary packages
from __future__ import print_function
import argparse
import time
import cv2
import imutils
import numpy as np
from …Run Code Online (Sandbox Code Playgroud) 我在这里问一些关于 Pytorch 和卷积自动编码器的更一般的问题。
顺便说一句,我想制作一个对称的卷积自动编码器来对不同图像大小的黑白图像进行着色。
self.encoder = nn.Sequential (
# conv 1
nn.Conv2d(in_channels=3, out_channels=512, kernel_size=3, stride=1, padding=1),
nn.ReLU,
nn.MaxPool2d(kernel_size=2, stride=2), # 1/2
nn.BatchNorm2d(512),
# conv 2
nn.Conv2d(in_channels=512, out_channels=256, kernel_size=3, stride=1, padding=1),
nn.ReLU,
nn.MaxPool2d(kernel_size=2, stride=2), # 1/4
nn.BatchNorm2d(256),
# conv 3
nn.Conv2d(in_channels=256, out_channels=128, kernel_size=3, stride=1, padding=1),
nn.ReLU,
nn.MaxPool2d(kernel_size=2, stride=2), # 1/8
nn.BatchNorm2d(128),
# conv 4
nn.Conv2d(in_channels=128, out_channels=64, kernel_size=3, stride=1, padding=1),
nn.ReLU,
nn.MaxPool2d(kernel_size=2, stride=2), #1/16
nn.BatchNorm2d(64)
)
self.encoder = nn.Sequential (
# conv 5
nn.ConvTranspose2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, …Run Code Online (Sandbox Code Playgroud) machine-learning computer-vision neural-network deep-learning pytorch
我正在尝试获取图像中的四个坐标,以便可以对其应用透视变换。我需要一个四边多边形,它不会裁剪图像中的任何内容并覆盖最小区域。我尝试了一些像“minAreaRect()”这样的函数,但它给出了最小面积矩形,而不是使用四边多边形的可能最小面积。为了您的理解,我提供测试图像。 测试图像 -> 将内容与四边形多边形绑定,但不应丢失任何内容
我可以使用轮廓和 minAreaRect() 函数在其上绘制一个矩形,但这并不是使用四个边获得最小面积的最佳选择。我坚信,有任何可能的方法可以让我们在其上绘制一个四边多边形,以最小的面积覆盖图像上存在的所有内容。
谢谢...
我有图像的两个坐标 (x, y)
Point N: (x = 2314, y = 751), Width = 2880, Hight = 2304
Point S: (x = 1533, y = 670), Width = 2880, Hight = 2304
Run Code Online (Sandbox Code Playgroud)
当我在 matplotlib 中绘制它们时,它们看起来像这样。(尽管我也在这里绘制了其他一些点。) -
现在,我想计算S and N
我知道的 X 射线板和 X 射线机器之间的距离是 180 厘米。
我已经尝试过使用该math功能。
distance = math.sqrt( ((N[0]-S[0])**2)+((N[1]-S[1])**2) )
print(distance)
Run Code Online (Sandbox Code Playgroud)
这给了我这样的结果
755.2747844327918
但我需要知道距离(以米为单位)。我怎样才能以某种方式做到这一点?
据我所知,"32位"等于2 ^ 32,这意味着我可以用32位操作系统定义4GB的内存.并且"64位"是2 ^ 64,允许15EB.因此,使用64位操作系统,我们可以在计算机中放入更多内存.
但是,我对另一点感到困惑.
我们可以在32位的情况下看到我们在系统中有(比方说)4GB的物理内存,我们将4GB除以32位整数的大小,我们可以存储一些整数(称为N)记忆.并且,在64位中,计算是4GB除以64位整数的大小,因此我们只能存储一半的整数.结果,对于64位,我们无法存储具有相同内存的整数.
这是否意味着微软通过在32位和64位版本的操作系统中将此内存显示为"4GB"来欺骗我们?
architecture computer-architecture computer-vision 32bit-64bit
我有一个关于硬币识别的作业。我国的硬币有两种颜色:金色和银色。我如何识别金色?
我已经从由几个硬币组成的图像中裁剪了每个硬币。我想知道如何识别金币。
我的讲师建议:
我的方法如下:
我已经完成了第 1 步和第 2 步,但我被困在了第三步。我不知道如何区分金色和银色硬币。我应该使用哪种方法在 MATLAB 中区分它们?
computer-vision ×10
opencv ×5
python ×4
image ×2
matlab ×2
32bit-64bit ×1
architecture ×1
colors ×1
dlib ×1
geometry ×1
math ×1
ocr ×1
python-3.x ×1
pytorch ×1
visual-c++ ×1