拍摄一个物体的图像(在这种情况下是预定义的物体)并开发一种算法来从具有不同复杂度的背景的照片中剪切该物体有多难.
除此之外,照片的对象(比如房子,汽车,狗 - 但总是一种类型)需要转换为3d渲染.我知道有三个渲染引擎可供选择(有成本,免费或有一些条款),但为了实现这一点,对象(主题)需要以各种方式进行测量 - 例如,如果这是一个人,我们需要测量高度,肩部曲率,面部半径,每个手指的长度等.
解决这个问题的可行性是什么?有人知道这个研究领域有什么特别好的联系吗?我已经看到了这个问题的开源解决方案,这让我遇到了一个问题,即在对象周围进行测量时可以轻松地测量对象.
谢谢
基本上我想拍摄2d图像(典型图像:比包含多个对象的复杂照片更容易等)
,
但实际上我想把它变成一个3d图像,所以我想做的不是建立一个3d渲染/建模引擎吗?
此外,我提供的链接进入3ds max,设置了一些属性,并进行渲染.
我的目标是提供2个图像文件,并获得关于这2个文件是否可以相同(在可接受的确定程度内)的真/假响应.
我意识到这个问题属于人工智能,并且比它看起来要复杂得多,所以我非常怀疑自己能够(或者甚至想要)做到这一点.我正在寻找的可能是图书馆或班级.我正在使用PHP.
提前致谢..
所有有用的答案/评论都会被投票.
更新:
我想知道我是否过于复杂,也许像imageMagick(imagick)这样的更通用的库可以完成它吗?谁对imageMagick更有经验?
php artificial-intelligence image image-processing image-recognition
是否存在可自由访问的API来识别非面孔?或者有没有办法在face.com API上使用faces.detect调用非面部?
我想要一些可以识别牌照图片的状态的东西.
我希望将OCR和ICR识别功能集成到我们正在构建的业务应用程序中,以扫描表单和其他此类文档.我已经搜索了几个小时,想出了Abbyy,IRIS和另外几家以4位数的价格销售他们的SDK的公司.您知道任何免费或负担得起的OCR/ICR引擎吗?
根据我的研究,Canny Edge Detector对于检测图像边缘非常有用.在我付出很多努力之后,我发现OpenCV函数可以做到这一点,也就是说
Imgproc.Canny(Mat image, Mat edges, double threshold1, double threshold2)
Run Code Online (Sandbox Code Playgroud)
但是对于低阈值和高阈值,我知道不同的图像有不同的阈值,所以我知道是否有任何快速自适应阈值方法可以根据不同的图像自动分配低和高阈值?
我是CV领域的新手,我的任务相对简单,我想分析多米诺骨牌的价值观.
我使用了blob分析方法,因为我使用的是纯Java代码,它往往比原生C慢.后台数据因为它可能有blob而导致我出现问题.
经过太多的阅读后,我通过'模板匹配'方法听起来对我来说是最好的,因为它的资源需求和旋转/缩放容差很小,我可以轻松保存每一块多米诺骨牌的模板,然后在即将到来的时候匹配它图像用于分析和计数.
现在我想要的只是你对可以帮助我实现模板匹配的库/方法的指导,我更喜欢纯java,但如果没有找到选择,可以使用本机C库.
PS:如果您发现我选择的算法有误,请向我提供您的建议.
我想使用AForge.net来识别如下图所示的模式.
我使用过滤器来提取黄橙红色,所以我现在可以找到彩色斑点但是:
我想找到被大蓝圈包围的斑点(如图所示)
我想过滤具有椭圆形状的对象
我不想要确切的代码,只是向我展示我应该使用的基本大纲和功能.

这是我通过Tesseract引擎进行数字识别的iOS OCR代码:
Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"];
//set the tesseract variables
[tesseract setVariableValue:@"0123456789" forKey:@"tessedit_char_whitelist"];
NSString * temp = @"7";
[tesseract setVariableValue:temp forKey:@"tessedit_pageseg_mode"];
[tesseract setImage:argImage];
[tesseract recognize];
m_convertedText = [[tesseract recognizedText] copy];
Run Code Online (Sandbox Code Playgroud)
使用上面,我得到一些正确的图像.但是有时我会得到5而不是8,6而不是5等等.我的输入图像非常完美 - 二值化后的纯黑色和白色.
我还缺少其他任何Tesseract选项吗?我看到有600多个选项和非常稀疏的文档.
我能找到的最好的是这个网站列出了所有选项,但对于OCR初学者来说还不是很清楚.
如果有人通过使用tesseract的数字OCR达到了100%的准确率,那将非常有帮助.
我正在开发一款Android应用,它将识别GO板并为其创建SGF文件。
我制作了一个能够检测木板并扭曲透视图使其变为正方形的版本(下面的代码和示例图片),不幸的是,添加石头时它变得更难一点。(下面的图片)
关于普通棋盘游戏的重要事项:
如果我错了,请纠正我,但我认为我目前的方法不是一个好方法。是否有人对我如何将石头和线条与图片的其余部分区分开来有一个大致的了解?
我的代码:
Mat input = inputFrame.rgba(); //original image
Mat gray = new Mat(); //grayscale image
//convert image to grayscale
Imgproc.cvtColor( input, gray, Imgproc.COLOR_RGB2GRAY);
//try to improve histogram (more contrast)
equalizeHist(gray, gray);
//blur image
Size s = new Size(5,5);
GaussianBlur(gray, gray, s, 0);
//apply adaptive treshold
adaptiveThreshold( gray, gray, 255, Imgproc.ADAPTIVE_THRESH_GAUSSIAN_C, Imgproc.THRESH_BINARY,11,2);
//adding secondary treshold, removes a lot of noise
threshold(gray, gray, 0, 255, Imgproc.THRESH_BINARY + Imgproc.THRESH_OTSU);
Run Code Online (Sandbox Code Playgroud)
一些图像:

(来源:八十二.axc.nl …
我在udacity开始了tensorflow的过程,同时我正在网上寻找这个主题.
我认为典型的用例已经很好地解决了,我可以用自己的方式实现.换句话说,在某些地方存在经过训练的模型,用于准备使用的常见病例.我找到了zooModels,如果我找不到正确的东西,那就是我要找的东西.但是我无法意识到发布的ocr模型不能识别图像中的数字:
我需要训练自己的模特吗?有一个我不知道的存储库吗?