Python:为Windows 7安装Tesseract

Plu*_*ug4 6 python ocr

我的目标是在Windows 7计算机上使用Tesseract在Python 2.7中使用OCR,但是我在安装过程中遇到了问题。我尝试按照此处的说明进行操作但是“ tesseract-core-yyyymmdd.exe”和“ tesseract-langs-yyyymmdd.exe”的链接不再存在,并且在其他地方也找不到这些.exe。到目前为止,这是我所做的:

  1. 从官方的tesseract-ocr页面可执行文件安装了tesseract。
  2. 通过pip软件包“ wand”,“ PIL”,“ pyocr”进行安装。

现在,如果我在Python中执行以下操作:

from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io

加载这些软件包没问题,但是pyocr.get_available_tools()给了我一个空的清单。我确定这与上面缺少的安装.exe文件有关。在哪里可以找到它们?我还缺少其他东西吗?

Ash*_*nta 4

我只是尝试设置 pytesseract 并且它有效!我安装了 Windows 10 和 python 2.7。

您需要做的就是:

  1. 从http://aka.ms/vcpython27下载Visual basic C++并安装(常见安装步骤)
  2. 通过此链接从 python 下载 tesseract https://pypi.python.org/pypi/pytesseract

  3. 解压缩文件。

  4. 转到包含 unizip 文件的目录

  5. 运行此命令“ python setup.py install ”

  6. (附加)要测试它是否已安装,请转到 python shell 并运行此命令“ import pytesseract ”

我希望它有效!注意 pytesseract 是基于 google 的 OCR,它的工作原理与 tesseract 类似。