如何在没有Visual Studio的Windows上安装leptonica + tesseract在Anaconda中使用?

Vik*_*iia 3 python windows tesseract leptonica anaconda

我想从图像中执行文本识别,我想使用Python.我安装了Anaconda.现在我想安装Tesseract但我还需要安装Leptonica.我没有找到任何明确的说明如何在Windows中执行此操作.对于Leptonica我不想安装Visual Studio.那么有人可以提供明确的说明如何在Windows上安装leptonica和tesseract而不使用Visual Studio在anaconda中使用吗?谢谢.

c.P*_*rsi 5

以下是在Windows 7和Windows 8机器上使用tesseract 3.05 dev版本的简单步骤:

1-从官方tesseract-ocr页面安装tesseract来自其可执行文件(版本3.02 for windoes就足够了)

2-从http://domasofan.spdns.eu/tesseract/下载tesseract 3.05开发版的以下两个文件

有2个exe文件:

  • tesseract-core-yyyymmdd.exe没有语言数据的Tesseract核心应用程序
  • tesseract-langs-yyyymmdd.exe Tesseract可以使用的所有语言数据.

(yyyymmdd表示年份4位数,月份2位数字和第2位数字.)

该应用程序是便携式的,因此您可以将其安装在USB记忆棒或其他位置.

sub安装这些的步骤:

  1. 下载tesseract-core和tesseract-langs软件包.
  2. 双击tesseract-core包并将其解压缩到您想要的目录(一个名为"Tess_temp"的临时新文件夹).
  3. 双击tesseract-langs包并将其解压缩到同一目录,但在上面的"Tess_temp"文件夹中添加\ tessdata.例如,如果我将tesseract-core提取到c:\ Tess_temp,则tesseract-langs需要转到c:\ Tess_temp\tessdata.

  4. 现在将"Tess_temp"中的所有内容复制到上面步骤1中安装tesseract 3.02的位置(通常位于C:\ Program Files(x86)\ Tesseract-OCR中)(用3.05替换3.02材料)

  5. 它现在应该在Windows上使用3.05版本.将示例图像test.png(带文本)复制到此tesseract-ocr文件夹并打开cmd并键入以下命令:

    转到tesseract文件夹: cd C:\Program Files <x86>\Tesseract-OCR

    在test.png上运行tesseract: tesseract -l eng test.png test_text -psm 6

它会告诉你

Tesseract Open Source OCR Engine v3.05.00dev with Leptonica
Run Code Online (Sandbox Code Playgroud)

恭喜!(检查提取文本的test_txt.txt)

  • 您在答案中提到的链接根本不会打开 (3认同)