我使用了这些在Centos中正常工作的说明
从Centos中的源安装Tesseract OCR库
下载Leptonica和Teseract来源:
$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
Run Code Online (Sandbox Code Playgroud)
配置,编译,安装libs:
$ tar xzvf leptonica-1.69.tar.gz
$ cd leptonica-1.69
$ ./configure
$ make
$ sudo make install
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-3.01
$ ./autogen.sh
$ ./configure
$ make
$ sudo make install
$ sudo ldconfig
Run Code Online (Sandbox Code Playgroud)
下载语言(英语)并复制到tessdata文件夹:
$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
Run Code Online (Sandbox Code Playgroud)
享受它;)
小智 5
我编写了一个 bash 脚本来在 Centos 7 上安装 Tesseract 3.05。这将获取并安装所有依赖项,并安装英语、印地语、孟加拉语和泰语的语言文件。
GitHub 上提供的代码
https://github.com/EisenVault/install-tesseract-redhat-centos
希望这可以帮助。