我有以下简单的代码:
import textract
text = textract.process("text.pdf")
Run Code Online (Sandbox Code Playgroud)
但是,我收到以下错误:
FileNotFoundError: [WinError 2] The system cannot find the file specified
Run Code Online (Sandbox Code Playgroud)
但我确信我text.pdf在当前目录中有一个名为的文件。尽管如此,如果我创建一个名为的文档a.txt并将代码的第二行更改为:
text = textract.process("a.txt", extension='txt')
Run Code Online (Sandbox Code Playgroud)
然后问题就消失了。我也尝试过:
text = textract.process("text.pdf", extension='pdf')
Run Code Online (Sandbox Code Playgroud)
但我遇到了和以前一样的错误。
预先感谢您的帮助。
小智 0
遇到了同样的问题,并通过另外安装 pdftotext 解决了它。
conda install -c conda-forge pdftotext
Run Code Online (Sandbox Code Playgroud)
如果 pdftotext 丢失,文本将使用似乎有问题的回退。
| 归档时间: |
|
| 查看次数: |
680 次 |
| 最近记录: |