小编Ake*_*ten的帖子

试图阅读议会的日常工作，我发现文件被分成许多PDF文件，不能简单地通过浏览器打开阅读，必须单独下载。我的基本想法是下载所有文档并提取所有决策的标题

以前的线程建议使用 PyPDF2。显然，这在我的情况下根本不起作用。PDF 中的字符是希腊字母，因此编码可能与它有关。最重要的是，在文档的末尾，添加了一些图片（我不感兴趣）。

PyPDF2 有没有可能解决这个问题，还是我应该看看其他地方？

-2
推荐指数

1
解决办法

1507
查看次数

pdf ×1

小编Ake_ten的帖子