spa*_*del 1 ocr object-detection computer-vision yolo yolov4
我的图像如下所示:
我的目标是检测并识别该数字31197394
。我已经对文本识别的深度神经网络进行了微调。如果以以下格式提供,它可以成功识别正确的号码:
剩下的唯一任务是检测相应的边界框。为此,我尝试了darknet。不幸的是,它无法识别任何东西。有人知道在此类图像上表现更好的网络吗?我知道,亚马逊识别能够解决这个任务。但我需要一个可以离线工作的解决方案。因此,我仍然对存在有效的预训练网络抱有很高的希望。非常感谢你的帮助!
不要说暗网不起作用。这取决于您如何标记数据集。确实,您想要识别的数字太小,因此如果您在预处理阶段不对图像进行任何更改,神经网络要很好地识别它们就会很复杂。所以你可以做的肯定会起作用的是:
1---> 在标记之前,将所有图像的大小增加到当前大小的 2 倍(例如 1000*1000)
2---> 使用这个大小(1000 * 1000)用于 darket trainer,而不是 darknet 建议的默认大小 416 * 416。然后您必须更改配置文件
3---> 使用最新的 darknet 版本(yolo v4)
4---> 在配置文件上,始终将细分数保持为 1。
我还指出,此方法对内存过于贪婪,因此有必要提供 RAM > 16 GB 的机器。优点是它有效...
归档时间: |
|
查看次数: |
3727 次 |
最近记录: |