小编ing*_*gli的帖子

如何对 PDF 文件进行 OCR 并获取存储在 PDF 中的文本?

首先,如果之前有人问过这个问题,我深表歉意——我在现有的帖子中搜索了一段时间,但找不到支持。

我对 Fedora 对多页不可搜索 PDF 进行 OCR 并将此 PDF 转换为包含图像顶部文本层的新 PDF 文件的解决方案感兴趣。在 Mac OSX 或 Windows 上,我们可以使用 Adob​​e Acrobat,但在 Linux 上有没有解决方案,特别是在 Fedora 上?

似乎描述了一个解决方案 - 但不幸的是,我在检索精确图像时已经迷路了。

command-line ocr pdf

49
推荐指数
4
解决办法
4万
查看次数

默认为特定进程分配更高的优先级

我想配置我的桌面 Linux 系统,以便每当我开始运行特定程序(运行该程序的进程)时,相应的进程都会获得高优先级。这该怎么做?

我知道我可以针对每个运行程序的实例(即针对特定进程)单独执行此操作。但是如何为程序配置默认值(即为所有未来进程)?

内核版本:4.10.11-200.fc25.x86_64

fedora process priority nice

6
推荐指数
1
解决办法
1939
查看次数

tesseract:是否可以更改 OCRed pdf 中的字体输出?

跟进如何对 pdf 文件进行 OCR 并获取存储在 pdf 中的文本?我已经成功制作了 OCRed pdf 页面。

然而,在 Evince 中,没有显示这些字母。我的意思是我看不到字符,但我可以选择它们,复制它们并将它们成功粘贴到其他地方。这似乎不是 Evince 的 bug:https ://bugzilla.redhat.com/show_bug.cgi ? id = 1364201

使用 pdfsandwich 启动 pdf 页面的 OCR 时,tesseract 会生成一个页面

包含一种没有任何可用字形的字体(他们将其命名为 GlyphLessFont)。它只有 .notdef 和 .null 替换(正方形)。如果字符没有字形,Evince 将使用 .notdef 字形。Okular 突出显示文本的原因是因为它在图像中这样做,而不是像 evince 那样作为常规文本。

pdftotext 识别字符。

现在,问题是:可以告诉 tesseract 使用不同的字体吗?

ocr fonts pdf evince tesseract

5
推荐指数
1
解决办法
1460
查看次数

如何使 gnome-shell 日历在单击日历条目时打开日历应用程序的事件详细信息?

在 gnome-shell 的顶部栏中,显示日历项目。这很棒。但是,我错过了单击某个项目然后查看更多详细信息/或只是被引导至进化中的特定事件项目或另一个首选日历应用程序的可能性。

缺少的功能是:click on calendar item@top bar--> open default calendar's details about this calendar item

是否可以配置,如果可以,如何让 gnome-shell 日历在单击日历项时打开特定的日历应用程序?

evolution gnome-shell gnome3 calendar

5
推荐指数
1
解决办法
1737
查看次数

Fedora 升级后 openconnect VPN 停止工作

我最近升级到了 Fedora 25。从那时起,我通过 openconnect(Cisco AnyConnect Compatible VPN)的 VPN 连接停止工作。

当我现在尝试定义新的等效 VPN 连接时,我收到消息

Error: unable to load VPN connection editor
Run Code Online (Sandbox Code Playgroud)

这出现在 Wayland 和 X 下。我有 OpenConnect 版本 v7.07;我有 NetworkManager-openconnect-1.2.4-1.fc25.x86_64。

你能想出让编辑器重新工作的方法吗?或者你能指出一种手动定义这种连接的方法,绕过gnome吗?

fedora gnome vpn openconnect

3
推荐指数
1
解决办法
3862
查看次数