我想使用pdfminer来提取文本信息.我已经下载了pdfminer-20131113.我已经安装了python C:\python34.现在使用cmd,我正在设置setup.pypdfminer文件的路径.并运行以下命令.
python setup.py install
Run Code Online (Sandbox Code Playgroud)
但我收到以下错误.
> D:\pdfminer-20101226>python setup.py install
Traceback (most recent call last):
File "setup.py", line 3, in <module>
from pdfminer import __version__
File "D:\pdfminer-20101226\pdfminer\__init__.py", line 4
if __name__ == '__main__': print __version__
^
SyntaxError: invalid syntax
Run Code Online (Sandbox Code Playgroud)
这似乎是pdfminer的setup.py文件中的一些错误,我不知道如何解决.
另外,我在pdfminer的build文件夹中看到了一个pdf2txt.py文件.我也尝试使用它pdf2txt.py -o output.html pdffilename.pdf(使用完整路径).而不是转换它.它会打开pdf2txt.py文件.
该PDFMiner项目主页状态:
完全用Python编写.(适用于2.4或更高版本)
进一步向下:
安装Python 2.4或更高版本.(不支持Python 3.)
所以你必须安装Python 2才能运行这个项目.
或者,您可以尝试Python 3端口,pdfminer3k ; 它没有在20个月内看到任何更新,而PDFMiner确实有更新的版本,所以你的里程可能会有所不同.
| 归档时间: |
|
| 查看次数: |
10061 次 |
| 最近记录: |