使用python安装pdfminer时出现语法错误

Mav*_*ick 4 python python-3.x

我想使用pdfminer来提取文本信息.我已经下载了pdfminer-20131113.我已经安装了python C:\python34.现在使用cmd,我正在设置setup.pypdfminer文件的路径.并运行以下命令.

python setup.py install
Run Code Online (Sandbox Code Playgroud)

但我收到以下错误.

> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
  File "setup.py", line 3, in <module>
    from pdfminer import __version__
  File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
    if __name__ == '__main__': print __version__
                                               ^
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)

这似乎是pdfminer的setup.py文件中的一些错误,我不知道如何解决.

另外,我在pdfminer的build文件夹中看到了一个pdf2txt.py文件.我也尝试使用它pdf2txt.py -o output.html pdffilename.pdf(使用完整路径).而不是转换它.它会打开pdf2txt.py文件.

Mar*_*ers 6

PDFMiner项目主页状态:

完全用Python编写.(适用于2.4或更高版本)

进一步向下:

安装Python 2.4或更高版本.(不支持Python 3.)

所以你必须安装Python 2才能运行这个项目.

或者,您可以尝试Python 3端口,pdfminer3k ; 它没有在20个月内看到任何更新,而PDFMiner确实有更新的版本,所以你的里程可能会有所不同.


Sag*_*tha 6

这应该可以解决您在 Python 3 中的问题

pip install pdfminer.six
Run Code Online (Sandbox Code Playgroud)