相关疑难解决方法(0)

Adobe Reader命令行参考

对于不同版本的 Adobe(以前的Acrobat)Reader,是否有任何官方命令行(开关)参考

我在Adobe Developer Connection上找不到任何内容.

特别是我想:

  • 启动Reader并打开文件
  • 在特定位置打开文件(页面)
  • 关闭阅读器(或单个文件)

acrobat adobe-reader

84
推荐指数
4
解决办法
31万
查看次数

高级PDF使用Python解析(提取没有表格的文本等):什么是最佳库?

我正在寻找一个PDF库,它允许我从PDF文档中提取文本.我看过PyPDF,这可以很好地从PDF文档中提取文本.这样做的问题是,如果文档中有表,则表中的文本将与文档文本的其余部分一起提取.这可能会有问题,因为它会产生一些无效且看起来乱码的文本部分(例如,大量数字混在一起).

我正在寻找更高级的东西.我想从PDF文档中提取文本,不包括任何表格和特殊格式.那里有图书馆吗?或者我被迫对输出文本进行一些后处理以摆脱这些部分?

python pdf parsing text-extraction information-extraction

81
推荐指数
1
解决办法
11万
查看次数