小编A. *_*oza的帖子

从具有不同高度的表格行中提取pdf文本(java使用pdfbox库)

黑色形状是需要提取的文本:

黑色形状是需要提取的文本

到目前为止,我已经从列中提取了文本,但是是手动提取的,因为只有 5 个(对区域使用 Rectangle 类)。我的问题是:有没有办法对行执行此操作,因为矩形的大小(高度)不同,并且手动对 50 多行执行此操作将是一种暴行?更具体地说,我可以使用函数根据每行的高度更改矩形吗?或者有什么建议可能有帮助吗?

java rectangles pdfbox

3
推荐指数
1
解决办法
4414
查看次数

标签 统计

java ×1

pdfbox ×1

rectangles ×1