Vik*_*iia 3 python windows tesseract leptonica anaconda
我想从图像中执行文本识别,我想使用Python.我安装了Anaconda.现在我想安装Tesseract但我还需要安装Leptonica.我没有找到任何明确的说明如何在Windows中执行此操作.对于Leptonica我不想安装Visual Studio.那么有人可以提供明确的说明如何在Windows上安装leptonica和tesseract而不使用Visual Studio在anaconda中使用吗?谢谢.
以下是在Windows 7和Windows 8机器上使用tesseract 3.05 dev版本的简单步骤:
1-从官方tesseract-ocr页面安装tesseract来自其可执行文件(版本3.02 for windoes就足够了)
2-从http://domasofan.spdns.eu/tesseract/下载tesseract 3.05开发版的以下两个文件
有2个exe文件:
(yyyymmdd表示年份4位数,月份2位数字和第2位数字.)
该应用程序是便携式的,因此您可以将其安装在USB记忆棒或其他位置.
sub安装这些的步骤:
双击tesseract-langs包并将其解压缩到同一目录,但在上面的"Tess_temp"文件夹中添加\ tessdata.例如,如果我将tesseract-core提取到c:\ Tess_temp,则tesseract-langs需要转到c:\ Tess_temp\tessdata.
现在将"Tess_temp"中的所有内容复制到上面步骤1中安装tesseract 3.02的位置(通常位于C:\ Program Files(x86)\ Tesseract-OCR中)(用3.05替换3.02材料)
它现在应该在Windows上使用3.05版本.将示例图像test.png(带文本)复制到此tesseract-ocr文件夹并打开cmd并键入以下命令:
转到tesseract文件夹: cd C:\Program Files <x86>\Tesseract-OCR
在test.png上运行tesseract: tesseract -l eng test.png test_text -psm 6
它会告诉你
Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
Run Code Online (Sandbox Code Playgroud)
恭喜!(检查提取文本的test_txt.txt)