小编Joe*_*Joe的帖子

批量 OCR 许多 PDF

这已经在一年前在这里讨论过:

许多 PDF 文件的批处理 OCR(尚未 OCR)?

有没有办法批量处理尚未经过 OCR 处理的 OCR PDF?我认为,这是处理两个问题的当前状态:

批量 OCR PDF

视窗

  • Acrobat – 这是最直接的 OCR 批处理引擎。唯一的问题似乎是 1)它不会跳过已经被 OCR 处理过的文件 2)尝试向它扔一堆 PDF(一些旧的)并看着它崩溃。这是一个小马车。它会在遇到的每个错误时向您发出警告(尽管您可以告诉软件不要通知。但同样,它在某些类型的 PDF 上会死得很惨,因此您的里程可能会有所不同。

  • ABBYY FineReader (Batch/Scansnap)、Omnipage——这些一定是人类已知的一些最糟糕的编程软件。如果您能找到如何完全自动化(无提示)批量 OCR保存同名PDF,请在此处发帖。似乎我能找到的唯一解决方案在某处失败了——重命名、不完全自动化等。充其量,有一种方法可以做到,但是文档和编程太糟糕了,你永远不会发现。

  • ABBYY FineReader EngineABBYY Recognition Server - 这些确实是更多的企业解决方案,您可能最好让 acrobat 运行一个文件夹并尝试清除给您带来错误/崩溃程序的 pdf,而不是经历尝试的麻烦安装评估软件(假设您是一个简单的最终用户)。对于小用户来说似乎没有成本竞争力。

  • ** Autobahn DX 工作站** 这个产品的成本太高了,你大概可以买6个acrobat。不是真正的最终用户解决方案。如果您是企业设置,这对您来说可能是值得的。

Linux

  • WatchOCR – 不再开发,基本上不可能在现代 Ubuntu 发行版上运行
  • pdfsandwich – 不再开发,基本上不可能在现代 Ubuntu 发行版上运行
  • ** ABBY LINUX OCR ** - 这应该是可编写脚本的,并且似乎有一些不错的结果:

http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison

但是,就像他们按页面收费的许多其他 ABBYY 产品一样,您最好尝试让 Acrobat Batch OCR …

windows linux pdf ocr adobe-acrobat

22
推荐指数
2
解决办法
2万
查看次数

如何在文件创建时设置默认(非继承)acl 权限?

这是一个 freenas 盒子(FreeNAS-9.3-STABLE-201506292130)。

在基于 debian 的 linux 中,文件/目录的默认权限通常为 644/755(现在是 664/775?)。据我了解,发生这种情况是因为 umask 设置为 022 或 002,这控制着创建新文件的默认权限。但是在 freenas(windows acl 样式权限)中,默认文件创建仅继承包含目录的权限。我从 setfacl 手册页看到

setfacl(1) 手册页

有一个继承标志。但是,我更多的是寻找默认而不是继承。有没有办法改变这一点,让创建行为更接近基于 debian 的系统中所做的?也就是说,我希望文件是 644,目录是 755。我不希望新创建的文件只获得 755 权限,因为目录作为这些权限。

我一直在绞尽脑汁试图让一些事情发挥作用。我目前正在使用 NFSv4 ACL,当我尝试使用 POSIX ACL 时出现“品牌不匹配”错误,所以我一直坚持使用 windows 风格、freenas、freebsd、NFSv4、setfacl/getfacl 命令,我无法从我尝试的任何事情中获得上述行为。

$ mkdir test
$ cd test
$ ls -lat
drwxr-xr-x+  2 user  user   2 Aug  1 12:40 . 
drwxr-xr-x+ 67 user  user  67 Aug  1 12:40 ..
$ touch testfile
$ ls -lat
drwxr-xr-x+  2 user  user   3 Aug  1 12:40 . …
Run Code Online (Sandbox Code Playgroud)

freebsd freenas permissions acl

5
推荐指数
1
解决办法
2726
查看次数

Kvm 嵌套的 Virtualbox Windows 来宾

我的设置是:

  • L0:KVM,ubuntu
  • L1:Windows 10
  • L2:Virtualbox (ubuntu) 或 Bluestacks (Android Emulator)

症状:

  • Bluestacks 抱怨 Hyper-V 已启用且无法启动,即使它不在 Windows 的“附加功能”中。
  • 一旦我运行一个新的 VM,Virtualbox 将重新启动整个 Windows 来宾。我试过基本上改变我能找到的每一个设置。

我确实启用了嵌套:

$ systool -m kvm_intel -v | grep nested
    nested              = "Y"
$ cat /sys/module/kvm_intel/parameters/nested
Y
Run Code Online (Sandbox Code Playgroud)

在我的 VM 配置中('virsh edit')

<features>
  <acpi/>
  <apic/>
  <vmport state='off'/>
</features>
<cpu mode='custom' match='exact' check='partial'>
  <model fallback='allow'>Haswell</model>
  <feature policy='require' name='vmx'/>
</cpu>
Run Code Online (Sandbox Code Playgroud)

L1 来宾中的 systeminfo 说:

Hyper-V Requirements: A hypervisor has been detected. Features required for Hyper-V will not be displayed.
Run Code Online (Sandbox Code Playgroud)

知道为什么我不能使用 Windows 主机在 …

virtualbox ubuntu kvm-switch

4
推荐指数
2
解决办法
3475
查看次数