小编DrJ*_*ing的帖子

pyPdf无法从我的PDF中的某些页面中提取文本

我正在尝试使用pyPdf从多页PDF中提取和打印页面.问题是,文本不是从某些页面中提取的.我在这里放了一个示例文件:

http://www.4shared.com/document/kmJF67E4/forms.html

如果运行以下命令,则前81页不返回任何文本,而最后11页正确提取.有人可以帮忙吗?

from pyPdf import PdfFileReader  
input = PdfFileReader(file("forms.pdf", "rb"))  
for page in input1.pages:  
    print page.extractText()  
Run Code Online (Sandbox Code Playgroud)

python pdf

6
推荐指数
1
解决办法
1万
查看次数

标签 统计

pdf ×1

python ×1