我想将图像列表读入Python/Matplotlib,然后在图形中绘制此图像而不是其他标记(如点).我试过imshow但是我没有成功,因为我不能将图像移动到另一个位置并适当地缩放它.也许有人有个好主意:)

将图像显示到Qt小部件的最快方法是什么?我使用libavformat和libavcodec解码了视频,所以我已经有了原始RGB或YCbCr 4:2:0帧.我目前正在使用QGraphicsView和一个包含QGraphicsPixmapItem的QGraphicsScene对象.我目前通过使用内存缓冲区中的QImage构造函数将帧数据转换为QPixmap,并使用QPixmap :: fromImage()将其转换为QPixmap.
我喜欢这个结果,看起来相对较快,但我不禁想到必须有一个更有效的方法.我也听说QImage到QPixmap的转换很昂贵.我已经实现了一个在小部件上使用SDL覆盖的解决方案,但我想继续使用Qt,因为我能够使用QGraphicsView轻松捕获点击和其他用户与视频显示的交互.
我正在使用libswscale进行任何所需的视频缩放或颜色空间转换,所以我只想知道是否有人在执行所有处理后有更有效的方式显示图像数据.
谢谢.
我的朋友在一家非盈利组织工作,致力于阻止非法剥削未成年人,例如craigslist.org,这是一种比较流行的媒体.问题是,现在或在不久的将来,是否有可能开发一种算法来分析人的照片并返回他们相对年龄的预测.
这听起来像是一项庞大的任务.我唯一的想法是某种贝叶斯概率系统.我知道即使人们经常难以判断某人的年龄,但贝叶斯垃圾邮件过滤器被宣传为"人类准确度的10倍",所以也许这可能吗?
虽然我很缺乏经验.如果其他人可以建议这是否可行,我是否会感激,如果是这样,何时何地?
编辑:谢谢大家的回复.Smoore这项研究非常有帮助,但我认为Hal的解决方案暂时是最实用的.
我想要做的是一个简单的应用程序的图像识别:
任何链接?任何提示?任何API?thxs :)
python algorithm image image-processing python-imaging-library
我有一个视频输入,用移动相机拍摄并包含移动物体.我想稳定视频,以便所有静止物体在视频输入中保持静止.我怎么能用OpenCV做到这一点?
即,例如,如果我有两个图像prev_frame和next_frame,我如何变换next_frame,以便摄像机看起来静止?
我正在尝试创建一个类似于罪恶之城或其他电影的效果,除了图像中的所有颜色之外,它们都会删除所有颜色.
我有一个RGB图像,我想转换为灰度,但我想保持一种颜色.
这是我的照片:

我想保持红色.其余的应该是灰度的.
这是我的代码输出到目前为止(你可以看到区域是正确的,我不知道为什么它们是白色而不是红色):

到目前为止,这是我的代码:
filename = 'roses.jpg';
[cdata,map] = imread( filename );
% convert to RGB if it is indexed image
if ~isempty( map )
cdata = idx2rgb( cdata, map );
end
%imtool('roses.jpg');
imWidth = 685;
imHeight = 428;
% RGB ranges of a color we want to keep
redRange = [140 255];
greenRange = [0 40];
blueRange = [0 40];
% RGB values we don't want to convert to grayscale
redToKeep = zeros(imHeight, imWidth);
greenToKeep …Run Code Online (Sandbox Code Playgroud) 通过我的新作业,我正在寻找一种方法来检测图像上是否存在文本.图像是地图 - 例如可以是谷歌地图.任务是检测街道/城市标签的放置位置.
我知道,OpenCV库有算法,可以检测功能(例如人脸) - Haar分类或猪(方向梯度直方图),但我听说,学习这样的算法过程是相当困难的.
您是否知道可以执行此操作的任何算法,方法或库(检测图像上是否存在文本)?
谢谢,约翰
opencv image image-processing image-recognition computer-vision
我正在开发一款可以识别车牌(ANPR)的应用程序.第一步是从图像中提取牌照.我正在使用OpenCV来检测基于宽高比的印版,这非常有效:


但正如您所看到的,OCR结果非常糟糕.
我tesseract在我的Objective C(iOS)环境中使用.这些是init启动引擎时的变量:
// init the tesseract engine.
tesseract = new tesseract::TessBaseAPI();
int initRet=tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding], [language UTF8String]);
tesseract->SetVariable("tessedit_char_whitelist", "BCDFGHJKLMNPQRSTVWXYZ0123456789-");
tesseract->SetVariable("language_model_penalty_non_freq_dict_word", "1");
tesseract->SetVariable("language_model_penalty_non_dict_word ", "1");
tesseract->SetVariable("load_system_dawg", "0");
Run Code Online (Sandbox Code Playgroud)
如何改善结果?我是否需要让OpenCV进行更多的图像处理?或者有什么我可以用tesseract改进?
我一直试图在越线时计算汽车并且它可以工作,但问题是它多次计算一辆车是荒谬的,因为它应该被计算一次
这是我正在使用的代码:
import cv2
import numpy as np
bgsMOG = cv2.BackgroundSubtractorMOG()
cap = cv2.VideoCapture("traffic.avi")
counter = 0
if cap:
while True:
ret, frame = cap.read()
if ret:
fgmask = bgsMOG.apply(frame, None, 0.01)
cv2.line(frame,(0,60),(160,60),(255,255,0),1)
# To find the countours of the Cars
contours, hierarchy = cv2.findContours(fgmask,
cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
try:
hierarchy = hierarchy[0]
except:
hierarchy = []
for contour, hier in zip(contours, hierarchy):
(x, y, w, h) = cv2.boundingRect(contour)
if w > 20 and h > 20:
cv2.rectangle(frame, (x,y), (x+w,y+h), (255, 0, 0), …Run Code Online (Sandbox Code Playgroud) 通过PIL(与此问题相关),我在哪里可以获得全面的图像模式列表?我看到"RGB","RGBX",我的代码以某种方式具有"BGRX",即使它在我可以看到的PIL文档中没有提到.例如,如何查看与Windows API调用交互时哪个,PIL支持哪些以及选择哪种正确模式?
基本上我对图像模式知之甚少,并且想要学习的不仅仅是用什么字母来使它神奇地起作用.