相关疑难解决方法(0)

如何从PDF文件中提取文本和文本坐标?

我想用PDFMiner从PDF文件中提取所有文本框和文本框坐标.

许多其他Stack Overflow帖子解决了如何以有序方式提取所有文本,但是如何进行获取文本和文本位置的中间步骤?

给定一个PDF文件,输出应该类似于:

   489, 41,  "Signature"
   500, 52,  "b"
   630, 202, "a_g_i_r"
Run Code Online (Sandbox Code Playgroud)

python pdf pdfminer

21
推荐指数
3
解决办法
2万
查看次数

如何从PDF文件中提取Notes和突出显示的部分

有没有办法以编程方式从PDF文件中提取突出显示的文本和注释?欢迎任何语言.我找到了几个包含Python,Java和PHP的库,但是没有一个能够完成这项任务.

我不知道是否可能.我也知道有些程序会创建额外的文件来保存这类信息(如果我没有错,Kindle会生成另一个文件.)但目前这些文件超出了范围.

pdf information-retrieval

10
推荐指数
2
解决办法
1万
查看次数

任何通过Python突出显示给定单词的pdf文档的方法?

我之前得到了一些关键字,我想通过 python 搜索 pdf 文档并突出显示它们。像pdfMiner这样的库是否可行?

python pdf pdf-generation python-module

6
推荐指数
1
解决办法
1887
查看次数