首先,如果之前有人问过这个问题,我深表歉意——我在现有的帖子中搜索了一段时间,但找不到支持。
我对 Fedora 对多页不可搜索 PDF 进行 OCR 并将此 PDF 转换为包含图像顶部文本层的新 PDF 文件的解决方案感兴趣。在 Mac OSX 或 Windows 上,我们可以使用 Adobe Acrobat,但在 Linux 上有没有解决方案,特别是在 Fedora 上?
这似乎描述了一个解决方案 - 但不幸的是,我在检索精确图像时已经迷路了。
command-line ocr pdf
command-line ×1
ocr ×1
pdf ×1