Jos*_*pez 7 camera face-recognition object-recognition
设置一个舞台,在一个区中有200 +模拟摄像机到中央监控站,但这些摄像机没有识别面部或物体.是否可以对这些相机实施面部检测?这些相机必须具备哪些先决条件?如何加载这些相机发送和处理的图像?
由于您的问题并不解决特定的编码问题,而是侧重于如何解决模式识别任务的一般概念,因此我想向您提供一些必须考虑的步骤的概述。正如您已经注意到的,我写了一些关于模式识别(PR)的文章。嗯,这就是您想要做的,除了模式分析之外,这实际上是第 2 步。
\n\n让我们从这样的 PR 管道开始:
\n\n要分析信号,首先必须有信号。收集这个信号是第一步,让我告诉你一件事:这里没什么可做的,但错误很多。对于您来说,当您想要从模拟摄像机获取视频信号时,首先要做的就是进行 A/D 转换,这样您就可以获得可以使用的数字信号。我对你们相机的视频质量没有任何印象,但请记住一件事:输入到特征提取 (FE) 工具中的信号几乎肯定是每个 FE 步骤的单帧。因此,请检查帧的质量,而不是整个视频的质量,这可能会给您留下错误的印象。除此之外,您无法真正影响信号采集。我没有写任何有关如何从摄像机访问模拟视频的内容,只是因为没有有关其环境的信息。
\n\n现在,当您拥有一些数字信号时(当然您也可以使用模拟信号执行此操作,但为了简单起见,我将在这里仅介绍数字预处理),您希望充分利用它。这是什么意思?您收集(或观察)的每个信号X基本上都是真实(未损坏)信号S和某种噪声的混合物N:
X = S + N
你理想中想要拥有的是S。如果您设法降低噪声N,您就可以减少其对整体信号的贡献X。因此,在预处理过程中,您经常会进行某种过滤。例如,对于图像,您可以在单个帧上应用中值滤波器来处理Salt 和 Petter 噪声。但是信号处理可以有许多不同的方面,您必须针对您的特定任务阅读该主题。长话短说:您希望通过减少噪声、伪影等来提高信号质量......
现在您有了足够质量的信号(这是一个假设,我对您的特定设置一无所知)。您现在想要进行特征提取。这是什么?仅单个视频帧就包含大量信息。假设您的分辨率为 720\xc3\x97576 像素,那么您已经有超过 400.000 个值,这甚至不是一个好的图像质量。首先:并不是每个像素都对您想做的事情感兴趣。我现在只考虑人脸识别任务:您需要显示人脸的像素。所有其他像素对您来说都不那么有趣。您现在必须做两件事,首先检测人脸,然后进一步处理以检测人员。对于一般的人脸检测,有不同的方法,例如模式匹配、纹理匹配或卷积神经网络 (CNN)。成功检测到人脸后,您将如何处理该人脸?同样,您有不同的选择,例如特征脸、尺度不变特征变换 (SIFT) 或 CNN。
\n\n此外,您的分类算法需要训练。训练算法意味着针对特定目标优化其参数。这里变得非常棘手:您不仅需要样本数据(您可以从相机收集这些数据),而且还需要标签。对于面部检测,您可以获得一些不错的预训练算法,这些算法也应该适用于您的数据。然而,对于面部识别,您需要来自您想要检测的每个人的样本。并且你必须对它们进行注释。您将需要大量的图像,最好用您用于识别的相机拍摄。同样,有预先训练的模型,但您仍然必须向这些预先训练的模型展示您想要识别的新面孔。
\n\n整个管道假设您有足够的输入信号质量,但我不确定。如果是这样,它会为您提供有关完成任务所需步骤的快速指南。如果第一步成功了,那么第二步就不再是大事了。第 3 步将是最具挑战性的,因为您必须有一些训练数据。
\n\n我没有写任何有关不同国家隐私法的内容。我只是希望您尊重您可能面临的任何限制!
\n| 归档时间: |
|
| 查看次数: |
234 次 |
| 最近记录: |