如何编写文本搜索和替换PDF文件

rpi*_*key 18 javascript pdf replace

我如何能够以编程方式搜索和替换大量PDF文件中的某些文本?我想删除已添加到一组文件的URL.我已经能够在Adobe Pro的批处理下使用javascript删除链接,但链接文本仍然存在.我已经看到了使用文本touchup的建议,它可以手动工作,但我不想手动修改1300个文件.

Chr*_*lan 15

由于文档格式的图形性质,在PDF中查找文本本质上很难 - 您搜索的字母在文件中可能不是连续的.也就是说,CAM :: PDF具有一些搜索替换功能和启发式功能.给changepagestring.pl一个尝试,看看它是否适用于你的PDF文件.

  • 非常感谢 Chris 的回答以及 CPAN 模块。这对我来说效果很好。希望 Google 能够找到此页面,我在搜索中没有看到 CAM::PDF 模块。罗杰 (2认同)
  • @rpilkey 任何人都可以为我提供一个示例,因为我是 Perl 新手,而且我不知道如何运行该包。 (2认同)

小智 6

我也变得绝望了.经过10次PDF编辑器安装后,所有这些都需要花钱,但没有成功:

pdftk +编辑器就足够了:

替换PDF文件中的文本

  • 使用pdftk解压缩PDF页面流

    pdftk original.pdf输出original.clear.pdf解压缩

  • 替换文本(有时这是有效的,有时它没有).

  • 修复已修改(现在已损坏)的PDF

    pdftk original.clear.pdf输出original.clear.fixed.pdf

(来自Joel Dare)