相关疑难解决方法(0)

使用 Camelot 查找 PDF 尺寸

我正在使用 Camelot 读取完整的 PDF 并从每个 PDF 中提取大约 112 个属性。

我使用表区域来提取属性

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38, 340 ,50, 328']) 
Run Code Online (Sandbox Code Playgroud)

问题是对于所有文档中的相同属性,表区域并不是恒定的。有时,我会在另一个文档的 x 或 y 坐标下方几个像素处找到相同的属性。

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38,350,50,338']) 
Run Code Online (Sandbox Code Playgroud)

有没有办法从同一区域获取确切的属性,而不管提取任何文档?

python pdf-extraction python-camelot

6
推荐指数
1
解决办法
2952
查看次数

标签 统计

pdf-extraction ×1

python ×1

python-camelot ×1