相关疑难解决方法(0)

如何创建带有扫描页面但可选择文本的 PDF?

今天,我从我们的供应商那里收到了一份 PDF,其中包含几页带有签名等的打印和扫描页面。我在 Acrobat Reader DC 中打开了它。但令我惊讶的是,可以从明显扫描的图像中选择文本并将其复制为文本。看截图:

使用可选文本扫描的 PDF

这背后显然有一些 OCR,因为复制的文本包含错误。但这怎么可能呢?我以前从未见过这个,这怎么可能创建?

pdf adobe-reader ocr adobe-acrobat

33
推荐指数
2
解决办法
9555
查看次数

许多 PDF 文件的批处理 OCR(尚未 OCR)?

我使用 Google 桌面搜索(我使用的是 Vista),但我的存档文件夹中并未识别出所有的 PDF 文件。这是正常的,因为“包含扫描图像的 PDF 文件”未编入索引( http://desktop.google.com/support/bin/answer.py?hl=zh_CN&answer=90651 )

所以我想对我的许多尚未 OCR 的 PDF 文件进行 OCR。 我的目标:我给程序一个文件夹,它在子文件夹中单独搜索需要转换为 PDF-OCRed 文件的 PDF 文件。

注意:过去,如果 PDF 文件受密码保护,我会使用另一批(付费)工具删除密码:verypdf.com "pwdremover" http://www.verypdf.com/pwdremover/

任何(不是太贵)的想法?

我已经尝试过:当时 xp 上的 Finereader 6 pro,但没有包含批处理器... Paperfile paperfile.net 使用 Tesseract http://code.google.com/p/tesseract-ocr/。但是OCR只是PDF转文本,不是PDF转PDF!还有另一个项目http://code.google.com/p/ocropus/

提前致谢 ;)

pdf ocr desktop-search

10
推荐指数
2
解决办法
4万
查看次数

标签 统计

ocr ×2

pdf ×2

adobe-acrobat ×1

adobe-reader ×1

desktop-search ×1