mil*_*_15 5 opencv neural-network python-3.x keras data-science
我正在用一个36x60形状的眼睛图像训练神经网络。所以我只能使用36x60的图片预测结果吗?但是在我的应用程序中,我有一个视频流,该视频流分为多个帧,每帧预测68个地标点。在眼范围内,我可以选择视点,然后使用OpenCV中的“ boundingrect”功能,很容易获得裁剪的图像。但是此图像没有格式36x60。获取可用于预测的36x60数据的正确方法是什么?或者如何将神经网络用于其他形式的数据?
神经网络(就我所遇到的而言)具有固定的输入形状,仅允许批量大小自由。这(可能)适用于你见过的每一个令人惊奇的神经网络。不要太害怕通过现成的采样来重塑图像以达到网络的预期输入大小。鲁棒的计算机视觉网络通常基于增强数据进行训练;随机缩放、倾斜和以其他方式转换,以便扩大网络处理这种不可避免的缩放情况的能力。
当然,也有一些警告。用于预测的输入应尽可能与其训练所用的数据集相似,也就是说,模型应应用于其设计的数据。例如,考虑为卫星应用创建的对象检测网络。如果将相同的网络应用于无人机图像,则对象的相对大小可能比网络设计的对象(特别是其锚框大小)大得多。
Tl;dr:假设您使用正确的网络来完成这项工作,请不要害怕缩放图像/帧以适应网络的输入。