Pre*_*tyP 50 python tesseract python-3.x python-tesseract
我试图在python中使用pytesseract但总是最终得到错误:
"TesseractNotFoundError:没有安装tesseract,或者它不在你的路径中"
pytesseract和tesseract安装在系统中.我是python的新手,所以如果有人可以帮助我,我将非常感激
小智 43
我尝试像其他人提到的那样添加路径变量,但仍然收到同样的错误.什么工作是将此添加到我的脚本:
pytesseract.pytesseract.tesseract_cmd = r"C:\ Program Files(x86)\ Tesseract-OCR\tesseract.exe"
Ali*_*Ali 26
因为我安装我得到这个错误pytesseract
有pip
,但忘了与安装它pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
.在这种情况下,使用以下命令安装它:
sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
Run Code Online (Sandbox Code Playgroud)
Kor*_*vis 16
您tesseract-ocr
的机器可能遗漏了您.请查看安装说明:https://github.com/tesseract-ocr/tesseract/wiki
在Mac上,您可以使用自制软件安装:
brew install tesseract
之后它应该运行良好
在Windows 10 OS环境下,以下方法适用于我:
https://github.com/tesseract-ocr/tesseract/wiki 下载tesseract并安装它。Windows版本可在此处获得:https: //github.com/UB-Mannheim/tesseract/wiki
从C:\ Users \ User \ Anaconda3 \ Lib \ site-packages \ pytesseract找到脚本文件pytesseract.py并将其打开。将以下代码从更改tesseract_cmd = 'tesseract'
为:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
您可能还需要添加环境变量 D:/Program Files (x86)/Tesseract-OCR/
希望对你有帮助!
注意:仅适用于 Windows
我今天遇到了这个问题,这里提到的所有答案都帮助了我,但我个人不得不挖掘很多才能解决它。因此,让我通过以非常简单的形式提出解决方案来帮助所有其他人:
从这里下载可执行的 64 位(如果您的计算机是 32 位,则为 32 位)exe 。
(文件名将是 tesseract-ocr-w64-setup-v5.0.0.20190526 (alpha))
安装它。让它自己安装在默认的 C 目录中。
现在转到您的环境变量(只需在开始菜单中搜索或转到即可到达Control Panel > System > Advanced System Settings > Environment Variables
)
a) 选择 PATH,然后编辑它。单击 NEW 并添加安装路径(通常为C:\Program Files\Tesseract-OCR\
)
现在你不会得到错误!
小智 7
我遇到了同样的问题。我希望您已经从这里安装并完成了pip install pytesseract
。
如果一切正常,您应该会看到该路径C:\Program Files (x86)\Tesseract-OCR where tesseract.exe
可用。
添加 Path 变量对我没有帮助,我实际上tesseract
在环境变量中添加了名称为C:\Program Files (x86)\Tesseract-OCR\tesseract.exe
.
tesseract
现在,在命令行中键入内容应该可以按预期工作,并为您提供使用信息。您现在可以pytesseract
这样使用(在运行之前不要忘记重新启动 python 内核!):
import pytesseract
from PIL import Image
value=Image.open("text_image.png")
text = pytesseract.image_to_string(value, config='')
print("text present in images:",text)
Run Code Online (Sandbox Code Playgroud)
享受!
小智 7
我正在Mac OS上运行并使用brew安装tesseract所以这是我对此的看法.由于pytesseract就是你如何从python访问tesseract,你必须指定tesseract在你的计算机上已经存在的位置.
对于Mac OS
尝试查找tesseract.exe的位置 - 如果您使用brew安装它 ,在终端上使用:
>brew list tesseract
Run Code Online (Sandbox Code Playgroud)
这应列出tesseract.exe所在的位置,或多或少的位置
> /usr/local/Cellar/tesseract/3.05.02/bin/tesseract
Run Code Online (Sandbox Code Playgroud)
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
Run Code Online (Sandbox Code Playgroud)
pytesseract.pytesseract.tesseract_cmd = R '/ USR /本地/地窖/超正方体/ 02年3月5日/ bin中/超正方体'
应该做的伎俩!
小智 7
在Jupyter Notebook中实际上对我有用的一件事是,在pytesseract.pytesseract.tesseract_cmd路径中使用双反斜杠而不是单个反斜杠:
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'
Run Code Online (Sandbox Code Playgroud)
我面临同样的问题。我只是使用这个可以帮助我的命令。
sudo apt install tesseract-ocr
Run Code Online (Sandbox Code Playgroud)
请注意,这仅适用于 Ubuntu。
sudo
是 Unix 专有命令(Linux、Mac、Rasbian 等),而apt
特定于 Ubuntu。
小智 6
对于 Mac:
这应该可以正常工作。
小智 6
当我尝试使用 pytesseract 制作文本提取器时,我也遇到了同样的错误,但解决方案在 pypi 站点中pytesseract的安装说明中有: pytesseract 有很多替代方法可以避免该错误,但是,添加一个参数在方法pytesseract.image_to_string中为我解决了这个问题,比如
tessdata_dir_config = "/usr/share/tesseract-ocr/4.00/tessdata"
output = pytesseract.image_to_string(image, lang='eng', config=tessdata_dir_config)
Run Code Online (Sandbox Code Playgroud)
你在进口吗
from tesseract import image_to_string
Run Code Online (Sandbox Code Playgroud)
不要从 pytesseract 导入