如何将 djvu 转换为 pdf 保留单词可搜索性?

glS*_*glS 10 search pdf print-to-pdf djvu conversion

我有一个 djvu 文件,我可以在其中搜索特定的单词。但是,如果我将其转换为 pdf(我尝试使用cutPDF和在线djvu-pdf工具),似乎就失去了搜索单词的可能性。

如何将 djvu 文件转换为 pdf 保留单词可搜索性?

小智 8

我将vindvaki的脚本打包到具有所需依赖项的 docker 映像中。你可以尝试一下:

  docker run --rm -u $(id -u):$(id -g) -v $(pwd):/opt/work ilyabystrov/djvu2pdf filename.djvu filename.pdf
Run Code Online (Sandbox Code Playgroud)

检查djvu2pdf-docker了解详细信息。


小智 7

很久以前我写了一个脚本来做到这一点。它本质上是围绕一些执行繁重工作的实用程序的粘合代码。我的脚本与当时其他工具之间的区别在于,我的脚本是唯一执行以下所有操作的脚本:

  • 具有与原始 DjVu 文件相似的压缩率(1.5-2x 大小而不是 10-20x 大小)
  • 保留的书签/目录元数据(用于在 pdf 阅读器中导航)
  • 保留用于搜索的嵌入文本层

话虽如此,这是非常原始的。我只是确保它适用于我自己的所有文件,并且从那以后就没有使用过。


bea*_*ker 1

你试过口径吗?Calibre 的贡献者提到支持 djvu 中的 OCR 文本。因此它可能会转换为带有可搜索文本的 PDF。

  • 尝试使用 calibre 将 djvu 转换为 pdf,但它完全毁了文档 (2认同)