ros*_*mcm 7 pdf find-and-replace editing
我有一个 PDF 文件,它是作为帮助文件编译的一部分生成的。文本文件中总是有最新的内容(例如“此版本中的新内容”类型的内容),而帮助和手册允许您包含文本文件中的内容,但它仅适用于 CHM 输出而不适用于PDF。
我想知道是否可以通过生成一个唯一的占位符字符串,然后使用一些工具(我可能需要编写一个)来搜索并用最新信息文本文件的内容替换该唯一字符串。
这可行吗?还是会破坏某种内部结构?
您可以使用(开源)qpdf
实用程序(适用于 Linux、Windows 和 MacOS X)将 PDF 解压缩为更易读的格式。从那里你可以去尝试其他答案中的一些其他建议:
qpdf.exe ^
--qdf ^
input.pdf ^
output.pdf
Run Code Online (Sandbox Code Playgroud)
文件 oUtput.pdf 将包含未压缩的对象流、所有对象按升序重新编号和重新排序,以及一些有用的注释散布到文件中。该文件可以在文本编辑器中进行编辑(如果它不会与剩余的二进制部分混淆)。
“这取决于。”
您可能需要一些东西:首先,文本不能被光栅化。如果是这样的话,那么所有的赌注都没有了。其次,必须嵌入整个字体。如果字体被子集化(这是最常见的情况),那么您可能没有所需的字形。最后,您可能希望将被修改的 textarea 的大小限制为尽可能小,以防止不得不处理大量回流。您希望在 plcaeholder 周围有尽可能多的空白。
现在,这可能不是您使用简单的文本编辑器能够做到的,但是可能有一些 PDF 处理工具可以为您进行替换。