Python PIL 由于某种原因无法打开 PDF

Hay*_*den 10 python pdf python-imaging-library python-2.7

所以我的程序能够打开 PNG,但不能打开 PDF,所以我这样做只是为了测试,但它仍然无法打开,甚至是一个简单的 PDF。我不知道为什么。

from PIL import Image

with Image.open(r"Adams, K\a.pdf") as file:
    print file

Traceback (most recent call last):
  File "C:\Users\Hayden\Desktop\Scans\test4.py", line 3, in <module>
    with Image.open(r"Adams, K\a.pdf") as file:
  File "C:\Python27\lib\site-packages\PIL\Image.py", line 2590, in open
    % (filename if filename else fp))
IOError: cannot identify image file 'Adams, K\\a.pdf'
Run Code Online (Sandbox Code Playgroud)

按照建议尝试 PyPDF2 后(顺便感谢您提供的链接),我的代码出现此错误。导入 PyPDF2

pdf_file= open(r"Adams, K (6).pdf", "rb")
read_pdf= PyPDF2.PdfFileReader(pdf_file)

number_of_pages = read_pdf.getNumPages()
print number_of_pages


Xref table not zero-indexed. ID numbers for objects will be corrected. [pdf.py:1736]
Run Code Online (Sandbox Code Playgroud)

小智 8

按照这篇文章: https: //www.geeksforgeeks.org/convert-pdf-to-image-using-python/,您可以使用pdf2image包将 pdf 转换为 PIL 对象。

这应该可以解决您的问题:

from pdf2image import convert_from_path

fname = r"Adams, K\a.pdf"
pil_image_lst = convert_from_path(fname) # This returns a list even for a 1 page pdf
pil_image = pil_image_lst[0]
Run Code Online (Sandbox Code Playgroud)

我刚刚用一页 pdf 尝试过。


Sim*_*mon 3

正如 @Kevin 所指出的(见下面的评论)PIL 支持编写pdf,但不支持阅读它们

要阅读 pdf,您将需要一些其他库。您可以查看此处,这是使用 PyPDF2 处理 PDF 的教程。

https://pythonhosted.org/PyPDF2/?utm_source=recordnotfound.com

  • 令人惊讶的是,Pillow 可以[写入](https://pillow.readthedocs.io/en/5.1.x/handbook/image-file-formats.html#pdf) pdf,但它只是无法读取它们。 (7认同)