标签: ocg

IText在PDF上编辑或删除图层

全部,

我正在使用IText在PDF上添加文本图层.现在我想编辑PDF上的现有图层,图层也仅由IText创建.似乎IText没有这样的方法来支持.

我想到的另一种方法是删除现有的Layer并在其位置放置新图层.似乎删除IText也不支持.有什么办法吗?

谢谢,谢谢.

java pdf itext layer ocg

5
推荐指数
1
解决办法
3613
查看次数

通过 OCG 从 PDF 中提取几何元素(按层)

所以我花了一个月的大部分时间来解决这个问题。我正在寻找一种方法,从由文件的 OCG(可选内容组)组织的矢量化 PDF 中提取几何元素(多段线、文本、弧线等),OCG 基本上是 PDF 图层。使用 PDFminer,我能够提取几何图形(LTCurves、LTTextBoxes、LTLines 等);使用 PyPDF2,我能够查看 PDF 中有多少个 OCG,尽管我无法访问与该 OCG 相关的几何图形。我在网上看到并尝试过一些黑客脚本可能能够解决这个问题,但无济于事。我什至求助于在文本编辑器中打开原始 PDF 数据,并半途而废地删除其中的部分内容,看看是否可以想出一些自定义解析技术来做到这一点,但同样无济于事。Adobe 的 PDF 手册充其量只是最少的,因此当我尝试创建解析器时这没有任何帮助。有谁知道这个问题的解决方案。

在这一点上,我愿意接受任何语言、使用任何操作系统的解决方案(尽管我更喜欢在 Windows 或 Linux 上使用 Python 3 的解决方案),只要它是开源/免费的。

这里有人能帮助结束这个黑暗的兔子洞吗?非常感激!

python pdf pypdf pdfminer ocg

1
推荐指数
1
解决办法
2803
查看次数

标签 统计

ocg ×2

pdf ×2

itext ×1

java ×1

layer ×1

pdfminer ×1

pypdf ×1

python ×1