相关疑难解决方法(0)

如何从PDF文件中提取文本和文本坐标?

我想用PDFMiner从PDF文件中提取所有文本框和文本框坐标.

许多其他Stack Overflow帖子解决了如何以有序方式提取所有文本,但是如何进行获取文本和文本位置的中间步骤?

给定一个PDF文件,输出应该类似于:

   489, 41,  "Signature"
   500, 52,  "b"
   630, 202, "a_g_i_r"
Run Code Online (Sandbox Code Playgroud)

python pdf pdfminer

21
推荐指数
3
解决办法
2万
查看次数

如何使用PDFMiner获取PDF中文本的位置?

PDFMiner的文档说:

PDFMiner允许人们获取页面中文本的确切位置

但是,我还没有找到如何做到这一点.PDFMiner的'文档'相当稀疏,所以我不明白如何做到这一点.

python pdf position pdfminer

16
推荐指数
1
解决办法
1万
查看次数

标签 统计

pdf ×2

pdfminer ×2

python ×2

position ×1