小编Kh4*_*zit的帖子

Ubuntu 20.04 升级,Python 缺少 libffi.so.6

我最近将我的操作系统升级到 Ubuntu 20.04 LTS。

现在,当我尝试在 Python 中导入像 Numpy 这样的库时,出现以下错误:

ImportError: libffi.so.6: cannot open shared object file: No such file or directory
Run Code Online (Sandbox Code Playgroud)

我尝试安装该libffi软件包,但 apt 找不到它:

sudo apt-get install libffi
Reading package lists... Done
Building dependency tree       
Reading state information... Done
E: Unable to locate package libffi
Run Code Online (Sandbox Code Playgroud)

python ubuntu ubuntu-20.04

64
推荐指数
5
解决办法
3万
查看次数

自然场景数字识别的深度学习解决方案

我正在解决一个问题,我想自动读取图像上的数字,如下所示:

在此输入图像描述

在此输入图像描述

可以看出,图像非常具有挑战性!这些线不仅在所有情况下都不是相连的,而且对比度也相差很大。我的第一次尝试是在经过一些预处理后使用 pytesseract。我还在这里创建了一个 StackOverflow 帖子。

虽然这种方法在单个图像上效果很好,但它并不通用,因为它需要太多的手动信息进行预处理。到目前为止,我拥有的最好的解决方案是迭代一些超参数,例如阈值、侵蚀/膨胀的过滤器大小等。但是,这在计算上是昂贵的!

因此我开始相信,我正在寻找的解决方案必须基于深度学习。我在这里有两个想法:

  • 在类似任务上使用预先训练的网络
  • 将输入图像分割成单独的数字,并以 MNIST 方式自行训练/微调网络

关于第一种方法,我还没有找到好的东西。有人对此有什么想法吗?

关于第二种方法,我首先需要一种方法来自动生成单独数字的图像。我想这也应该是基于深度学习的。之后,我也许可以通过一些数据增强取得一些好的结果。

有人有想法吗?:)

python ocr image-recognition mnist deep-learning

5
推荐指数
1
解决办法
1452
查看次数