Poppler的路径为pdf2image

Igg*_*ass 6 path python-3.x

我正在尝试使用pdf2image,看来我需要一个叫做propeller

(sum_env) C:\Users\antoi\Documents\Programming\projects\summarizer>python ocr.py -i fr13_idf.pdf
Traceback (most recent call last):
  File "c:\Users\antoi\Documents\Programming\projects\summarizer\sum_env\lib\site-packages\pdf2image\pdf2image.py", line 165, in __page_count
    proc = Popen(["pdfinfo", pdf_path], stdout=PIPE, stderr=PIPE)
  File "C:\Python37\lib\subprocess.py", line 769, in __init__
    restore_signals, start_new_session)
  File "C:\Python37\lib\subprocess.py", line 1172, in _execute_child
    startupinfo)
FileNotFoundError: [WinError 2] The system cannot find the file specified

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "ocr.py", line 53, in <module>
    pdfspliterimager(image_path)
  File "ocr.py", line 32, in pdfspliterimager
    pages = convert_from_path("document-page%s.pdf" % i, 500)
  File "c:\Users\antoi\Documents\Programming\projects\summarizer\sum_env\lib\site-packages\pdf2image\pdf2image.py", line 30, in convert_from_path
    page_count = __page_count(pdf_path, userpw)
  File "c:\Users\antoi\Documents\Programming\projects\summarizer\sum_env\lib\site-packages\pdf2image\pdf2image.py", line 169, in __page_count
    raise Exception('Unable to get page count. Is poppler installed and in PATH?')
Exception: Unable to get page count. Is poppler installed and in PATH?
Run Code Online (Sandbox Code Playgroud)

我尝试了此链接,但是下载东西并没有解决我的问题。

小智 13

所有下载的第一个poppler的从这里这里,然后将解压后it.In代码段只需添加poppler_path = R'C:\ Program Files文件\ poppler的-0.68.0 \ BIN'(用于如)如下图所示

from pdf2image import convert_from_path
images = convert_from_path("mypdf.pdf", 500,poppler_path=r'C:\Program Files\poppler-0.68.0\bin')
for i, image in enumerate(images):
    fname = 'image'+str(i)+'.png'
    image.save(fname, "PNG")
Run Code Online (Sandbox Code Playgroud)

现在它完成了。有了这个技巧,不需要添加环境变量。如果您有任何问题,请告诉我。


dat*_*ght 13

pdf2image 路径中的 Poppler

使用pdf2image时,需要满足一些依赖关系:

  1. 安装pdf2image

    pip安装pdf2image

  2. 安装 python-dateutil

    pip 安装 python-dateutil

  3. Poppler的安装

  4. 在环境变量中指定 Poppler 路径(系统路径)

在 Windows 上安装 Poppler

将 Poppler 添加到路径

  • 将安装的 Poppler 添加到位置:C:\Users\UserName\Downloads\Release-21.11.0-0.zip
  • 将 C:\Users\UserName\Downloads\Release-21.11.0-0.zip 添加到环境变量中的系统变量路径

在代码中指定 poppler 路径

pages = convert_from_path(filepath, poppler_path=r"actualpoppler_path")
Run Code Online (Sandbox Code Playgroud)


dee*_*sen 9

这是poppler没有正确安装。使用它您可以获得正确的安装包。

sudo apt-get install poppler-utils


Bel*_*val 8

pdf2image只是poppler的包装(不是螺旋桨!),要使用该模块,您需要在计算机上和路径中安装poppler-utils。

该过程链接在项目的自述文件的“如何安装”部分中。

  • 因此,在 Linux 上,它是“apt-get install poppler-utils”。 (11认同)
  • 在 Mac 上,它是 `brew install poppler` (6认同)
  • 我什至无法安装 poppler (4认同)

小智 8

这些 pdf2image 和 pdftotext 库后端要求是 Poppler,所以你必须安装

'conda install -c conda-forge poppler'

那么错误将得到解决。如果它仍然不适合您,那么您可以按照 http://blog.alivate.com.au/poppler-windows/安装此库。

  • 这不再维护。在这里下载:https://github.com/oschwartz10612/poppler-windows (2认同)

小智 6

对于窗户;解决PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH?


归档时间:

查看次数:

14393 次

最近记录:

6 年,3 月 前