Tesseract未找到错误

Pre*_*tyP 50 python tesseract python-3.x python-tesseract

我试图在python中使用pytesseract但总是最终得到错误:

"TesseractNotFoundError:没有安装tesseract,或者它不在你的路径中"

pytesseract和tesseract安装在系统中.我是python的新手,所以如果有人可以帮助我,我将非常感激

小智 43

我尝试像其他人提到的那样添加路径变量,但仍然收到同样的错误.什么工作是将此添加到我的脚本:

pytesseract.pytesseract.tesseract_cmd = r"C:\ Program Files(x86)\ Tesseract-OCR\tesseract.exe"


Ali*_*Ali 26

因为我安装我得到这个错误pytesseractpip,但忘了与安装它pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'.在这种情况下,使用以下命令安装它:

sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
Run Code Online (Sandbox Code Playgroud)

  • 对于 Windows 64 位,添加 pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe' (4认同)
  • 繁荣!干得好,先生给那个人一块饼干! (2认同)

Kor*_*vis 16

tesseract-ocr的机器可能遗漏了您.请查看安装说明:https://github.com/tesseract-ocr/tesseract/wiki

在Mac上,您可以使用自制软件安装:

brew install tesseract

之后它应该运行良好


ahb*_*bon 8

在Windows 10 OS环境下,以下方法适用于我:

  1. https://github.com/tesseract-ocr/tesseract/wiki 下载tesseract并安装它。Windows版本可在此处获得:https//github.com/UB-Mannheim/tesseract/wiki

  2. 从C:\ Users \ User \ Anaconda3 \ Lib \ site-packages \ pytesseract找到脚本文件pytesseract.py并将其打开。将以下代码从更改tesseract_cmd = 'tesseract'为:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

  3. 您可能还需要添加环境变量 D:/Program Files (x86)/Tesseract-OCR/

希望对你有帮助!


Jay*_*kia 8

注意:仅适用于 Windows


我今天遇到了这个问题,这里提到的所有答案都帮助了我,但我个人不得不挖掘很多才能解决它。因此,让我通过以非常简单的形式提出解决方案来帮助所有其他人:

  1. 这里下载可执行的 64 位(如果您的计算机是 32 位,则为 32 位)exe 。

    (文件名将是 tesseract-ocr-w64-setup-v5.0.0.20190526 (alpha))

  1. 安装它。让它自己安装在默认的 C 目录中。

  2. 现在转到您的环境变量(只需在开始菜单中搜索或转到即可到达Control Panel > System > Advanced System Settings > Environment Variables

a) 选择 PATH,然后编辑它。单击 NEW 并添加安装路径(通常为C:\Program Files\Tesseract-OCR\

现在你不会得到错误!


小智 7

我遇到了同样的问题。我希望您已经从这里安装并完成了pip install pytesseract

如果一切正常,您应该会看到该路径C:\Program Files (x86)\Tesseract-OCR where tesseract.exe可用。

添加 Path 变量对我没有帮助,我实际上tesseract在环境变量中添加了名称为C:\Program Files (x86)\Tesseract-OCR\tesseract.exe.

tesseract现在,在命令行中键入内容应该可以按预期工作,并为您提供使用信息。您现在可以pytesseract这样使用(在运行之前不要忘记重新启动 python 内核!):

import pytesseract
from PIL import Image

value=Image.open("text_image.png")
text = pytesseract.image_to_string(value, config='')    
print("text present in images:",text)
Run Code Online (Sandbox Code Playgroud)

享受!


小智 7

我正在Mac OS上运行并使用brew安装tesseract所以这是我对此的看法.由于pytesseract就是你如何从python访问tesseract,你必须指定tesseract在你的计算机上已经存在的位置.

对于Mac OS

尝试查找tesseract.exe的位置 - 如果您使用brew安装它 ,在终端上使用:

>brew list tesseract
Run Code Online (Sandbox Code Playgroud)

这应列出tesseract.exe所在的位置,或多或少的位置

> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract
Run Code Online (Sandbox Code Playgroud)

然后按照他们的指示:

pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
Run Code Online (Sandbox Code Playgroud)

pytesseract.pytesseract.tesseract_cmd = R '/ USR /本地/地窖/超正方体​​/ 02年3月5日/ bin中/超正方体​​'

应该做的伎俩!


小智 7

在Jupyter Notebook中实际上对我有用的一件事是,在pytesseract.pytesseract.tesseract_cmd路径中使用双反斜杠而不是单个反斜杠:

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
Run Code Online (Sandbox Code Playgroud)


Viv*_*nda 6

我面临同样的问题。我只是使用这个可以帮助我的命令。

sudo apt install tesseract-ocr
Run Code Online (Sandbox Code Playgroud)

请注意,这仅适用于 Ubuntu。
sudo是 Unix 专有命令(Linux、Mac、Rasbian 等),而apt特定于 Ubuntu。


小智 6

对于 Mac:

  1. 安装 Pytesseract(pip install pytesseract应该可以工作)
  2. 安装 Tesseract但只能使用自制软件,pip 安装不知何故不起作用。( brew install tesseract )
  3. 在你的设备上获取 Tesseract 的 brew 安装路径(brew list tesseract
  4. 将路径添加到您的代码中,而不是在 sys path 中。路径将与代码一起添加,使用 pytesseract.pytesseract.tesseract_cmd = '<path received in step 3>' - (例如pytesseract.pytesseract.tesseract_cmd = '/usr/local/Cellar/tesseract/4.0.0_1/bin /tesseract' )

这应该可以正常工作。


小智 6

当我尝试使用 pytesseract 制作文本提取器时,我也遇到了同样的错误,但解决方案在 pypi 站点中pytesseract的安装说明中有: pytesseract 有很多替代方法可以避免该错误,但是,添加一个参数在方法pytesseract.image_to_string中为我解决了这个问题,比如

tessdata_dir_config = "/usr/share/tesseract-ocr/4.00/tessdata"
output = pytesseract.image_to_string(image, lang='eng', config=tessdata_dir_config)
Run Code Online (Sandbox Code Playgroud)


Zam*_*mar 0

你在进口吗

from tesseract import image_to_string
Run Code Online (Sandbox Code Playgroud)

不要从 pytesseract 导入