Ubuntu 源中有一个很好的 PDF 查看器可以让我选择和复制文本吗?Okular for KDE 是一个很棒的应用程序,因为它拥有比文档查看器更多的工具。我看到 repos 有 Okular,但我想避免安装它附带的所有 KDE 依赖项。但是,我真正需要做的就是从 pdf 中选择和复制文本。什么能让我这样做?
如评论中所述,pdf文档中的文本是否可以选择为文本,取决于文本在文档中是作为图像还是作为文本。在后一种情况下,pdf据我所知,所有观众都支持选择文本。
但是,您确实有几个选项可以使文档中的文本“可读”
一个相对不为人知但非常好的(也)将pdf图像转换为文本的选项是gimageReader:
它有一个漂亮的界面,可以读取所选文本,显示在您的 pdf 文档旁边。
安装,使用它的ppa:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader
Run Code Online (Sandbox Code Playgroud)
您可能需要/想要为tesseract要使用的特定语言额外安装ocr 工具:
sudo apt-get install tesseract-ocr
Run Code Online (Sandbox Code Playgroud)
和特定的语言,例如
sudo apt-get install tesseract-ocr-eng
Run Code Online (Sandbox Code Playgroud)
还可以使用 轻松选择特定语言synaptic。
(至少)从 18.04 开始,gImageReader 位于存储库中,因此不再需要手动添加 ppa。
看看主 PDF 编辑器。对于您可以使用 PDF 文件执行的所有任务来说,这是一款出色的应用程序。
一些特点:
以及更多功能。来源
你可以从这里下载。
或者你可以直接安装它:
sudo apt-get install master-pdf-editor
Run Code Online (Sandbox Code Playgroud)