我有兴趣编写依赖于能够识别图片(或视频帧)中有脸的软件.它没有ID面部 - 所以没有其他指标:
它现在出现在便宜的数码相机中,所以我希望有这样的开源软件包,或者在推出自己的产品时很容易遵循的研究.
假设我有一个小位图,其中包含一个手写的数字(0..9).
是否可以使用(双层)感知器检测数字?
除了使用神经网络之外,还有其他可能从位图中检测单个数字吗?
ocr pattern-recognition artificial-intelligence perceptron neural-network
最终目标是看是否
包含
.
比较需要支持轻微失真,缩放,色差,旋转和亮度差异.
它可以是任何语言.我将运行此算法作为Web服务,所以如果我必须在c,c ++,python等中编写此部分,这没有问题.
matlab image-manipulation pattern-recognition image image-processing
在过去,我不得不开发一个作为规则评估员的程序.你有一个先行者和一些结果(行动),所以如果先行者躲到了真实的行动.
那时我使用了RETE算法的修改版本(有三个版本的RETE,只有第一个是公共的)用于先行模式匹配.我们在谈论一个大系统,每条规则有数百万次操作,一些操作员在几条规则中"重复".
我可能必须用其他语言再次实现它,即使我在RETE中有经验,有没有人知道其他模式匹配算法?有什么建议或者我应该继续使用RETE吗?
我正在寻找记录与特定声音相对应的事件,例如车门砰击,或者可能是烤面包机吐出的吐司.
系统需要比"响亮的噪声探测器"更复杂; 它需要能够将特定声音与其他大声噪声区分开来.
识别不需要零延迟,但处理器需要跟上来自始终打开的麦克风的连续输入数据流.
这个答案表明匹配的过滤器是合适的,但我对细节很朦胧.由于目标声音的变化,我不相信目标声音样本和麦克风流之间的音频波形数据的简单互相关将是有效的.
我的问题也与此类似,没有引起太多关注.
python java pattern-recognition real-time audio-fingerprinting
我正在尝试使用AForge.NET来检测图像上的粗白线.
它就像我得到的管道,是应用阈值过滤器后的理想结果.
我知道如何检测形状,我已经这样做了,但是这在任何形状下都不匹配,因为它没有边缘而且不是圆形.
我有检测等边形状的示例代码,但我不知道这是否相关.
public void DetectQuadrilateralType(Bitmap bitmap)
{
BlobCounter blobCounter = new BlobCounter();
blobCounter.ProcessImage(bitmap);
Blob[] blobs = blobCounter.GetObjectsInformation();
//Graphics object to draw
Pen pen;
Graphics g = Graphics.FromImage(bitmap);
SimpleShapeChecker shapeChecker = new SimpleShapeChecker();
for (int i = 0; i < blobs.Length; i++)
{
List<IntPoint> edgePoints = blobCounter.GetBlobsEdgePoints(blobs[i]);
List<IntPoint> corners;
if (i < edgePoints.ToArray().Length && i > -1)
{
try
{
if (shapeChecker.IsConvexPolygon(edgePoints, out corners))
{
PolygonSubType subType = shapeChecker.CheckPolygonSubType(corners);
pen = new Pen(colors[subType], 2);
g.DrawPolygon(pen, ToPointsArray(corners));
pen.Dispose();
}
} …Run Code Online (Sandbox Code Playgroud) 我有跟踪扫描文档,上面有徽标,我有另一张黑白图像,标识和样式相同(下面以黑白色显示).
如何确保此图像上是否存在徽标?

通常我会有很多扫描文件,OCR会拾取MTNL,但有时这些徽标只是由OCR无法识别的符号组成.
徽标的大小和位置发生变化,它们不会多次修复.它们可以放在文档的任何位置.
我想根据存在的徽标和符号组织和编目扫描图像.大多数文件可能是也可能不是英文,可能包含也可能不包含任何条形码,在这种情况下,徽标匹配会有所帮助.
我见过Aforge.NET库,但我不太确定要将哪些方法组合起来进行搜索.如果源目标具有不同的大小,则像素搜索非常慢并且失败.
我听说YouTube会进行某种直方图或热门签名匹配,以查看该视频是否包含任何受版权保护的内容.如果有人能在这种情况下指导我,我会很有帮助.
我理想的选择是C#和Aforge.NET,否则一些命令行工具将不胜感激.
c# pattern-recognition image-processing pattern-matching aforge
我有这个形象

如何OCR呢?我知道这很有挑战性,但我真的很感激任何帮助.
c# ocr pattern-recognition artificial-intelligence image-processing
我在知名人士的老中考试中看到一个例子Tom Mitchell,如下:
考虑在总共1000个特征的情况下学习分类器.其中50个是关于课堂的真实信息.另外50个功能是前50个功能的直接副本.最终的900个功能不提供信息.假设有足够的数据可靠地评估功能的有用性,并且功能选择方法使用了良好的阈值.
How many features will be selected by mutual information ?ltering?
Run Code Online (Sandbox Code Playgroud)
解决方案:100
How many features will be selected by a wrapper method?
Run Code Online (Sandbox Code Playgroud)
解决方案:50
我的挑战是如何实现这些解决方案?我做了很多尝试,但无法理解这背后的想法.
pattern-recognition classification machine-learning data-mining feature-selection
我正在尝试创建一个程序,可以在使命召唤的游戏视频中找到人物.我已经从这个视频中编制了一个约2200个单独图像的列表,其中包含人物或不包含人物.然后我尝试训练神经网络来分辨两组图像之间的差异.
然后,我将每个视频帧分成几百个网格矩形,然后用我的ANN检查每个视频帧.矩形重叠以尝试捕获网格之间的数字,但这似乎不能很好地工作.所以我有几个问题:
神经网络是否可行?我已经读过它们与其他机器学习算法相比非常快,最终我计划将它与实时视频一起使用,速度非常重要.
搜索图像框架中的数字以在ANN上进行测试的最佳方法是什么?我觉得我这样做的方式并不是很好.它绝对不是非常快或准确.每帧图像960 x 540大约需要一秒钟,并且精度较差.
我遇到的另一个问题是构建特征向量以用作ANN的输入的最佳方法.目前,我只是将所有输入图像缩小到25 x 50像素,并创建一个包含每个像素强度的特征向量.这是一个非常大的矢量(1250浮点数).有哪些更好的方法来构建特征向量?
有关我在此处所做的更详细的解释:CodAI:计算机视觉
编辑:我想要更多细节.计算要素的最佳方法是什么.我需要能够识别出许多不同位置的人物形象.我是否需要创建单独的分类器来识别直立,蹲伏和俯卧之间的区别?
c++ opencv pattern-recognition machine-learning neural-network