我正在使用 Ghostscript 将可搜索的 PDF 转换为图像 PDF,以便可以使用成像工具包使用命令行查看它们,如下所示:
gswin32 -o c:\temp\output%d.png -r300 -dTextAlphaBits=4 -dGraphicsAlphaBits=4 -dDOINTERPOLATE -dSAFER -sDEVICE=png16m c:\temp\test.pdf
Run Code Online (Sandbox Code Playgroud)
如果我添加 -dDOPDFMARKS 命令行参数,它会呈现注释标记,显示有注释,但没有注释文本。
有谁知道如何让 Ghostscript 渲染注释文本?我用谷歌搜索了它的生活,但没有任何运气。
这是可能的,但会很麻烦。
Ghostscript 是一个开源的 postscript 解释器。PDF 只是使用特殊预定义词典的 postscript 文件。在 Ghostscript 8.62 或更早版本中,字典作为 postscript 文本文件位于目录 /lib 中。/lib 内部有一个文件 pdf_draw.ps,用于将 PDF 渲染为您在 .png 文件中看到的内容。pdf_draw.ps 内部是 /drawidget 的定义,它绘制您看到的代表注释的小符号。在代码中他的位置,整个注释都是可用的,只是没有被使用。
一个简单的演示是在 /drawwidget 行正下方添加如下所示的 2 行 ( just after the /drawwidget { %...),并使用 gswin32c 在控制台中运行 gswin32。这将导致在控制台窗口中呈现 PDF 时显示 2 行。
/drawwidget { % <scalefactor> <annot> drawwidget -
dup /Contents known {dup /Contents get == } if
dup /T known { dup /T get == } if
Run Code Online (Sandbox Code Playgroud)
输出
(This is a test sticky note)
(Laurie Shufeldt)
Run Code Online (Sandbox Code Playgroud)
棘手的地方是定义如何处理注释,这就是它们不被显示的原因。
在这种情况下,一种方法可能是将脚注引用放置在小部件的顶部,并将脚注放置在页面底部,并设置文本格式,这对粘性的意图有意义。
或者,即时贴可以是就位的图像,类似于它们在 acrobat 中展开时的外观,但这会覆盖即时贴下方的内容。
实施的难度取决于实施过程中投入的精力。编辑pdf_draw.ps非常麻烦,但又快又容易。应该可以将这些 hack 放入自己的文件中并作为命令行的一部分调用它们。如果将更改放入标头中有效,那么“它应该”在当前版本的 Ghostscript 中工作,而不仅仅是旧版本。
预先定义允许的便签数量和脚注的固定位置将简化脚注的放置。如果便签具有超长文本,则文本需要具有特殊格式以允许换行,其中假定没有换行的短文本更容易编程。
也许您只想从便签中提取数据并将其放入数据库中。如果是这样的话,上面的代码很接近您所需要的。
| 归档时间: |
|
| 查看次数: |
2109 次 |
| 最近记录: |