标签: documents

淹没在文档中 - 推荐文档管理解决方案?

我最近一直在研究文档管理。

我想在家里和办公室整理我的文档。找到一个可以实际试驾的负担得起的解决方案是相当困难的。我下载的一些似乎不起作用(在全新的 Vista PC 上测试)。我在亚马逊上看到过一些像 Paperport 这样的软件,但不太确定它们是什么样的。

对于家庭,我想要一些东西来组织文件、全文搜索、良好的扫描仪集成、漂亮的界面等。

但对于办公室来说,这似乎更难。我需要一些可以执行正确工作流程并保留版本的东西。它将有一个审计跟踪。文件可以被批准、签入/签出等。我知道一些客户想要类似的东西。只需从共享驱动器导入数千个文档,并用杀死的欺骗者将它们编入索引,那就太好了。我想非常清楚文档的存储方式/位置,以便维护和备份清晰。

我的谷歌/推特搜索导致回到同样疲惫和模糊的网页,推动看起来昂贵和定制的解决方案。我想有些可能非常好,但很难说。

我不介意托管包,但总而言之,我不认为像现在这样好的 Google Docs 会起作用。有太多的怪癖和缺失的功能(与 Office 相比)。能够直接使用常见的 Office 文件格式非常重要。

我注意到八月份在这里问过的一个类似的问题,但似乎没有找到太多我可以轻松快速应用的解决方案。从那时起可能会有一些变化,所以我觉得值得一问。

documents

5
推荐指数
1
解决办法
482
查看次数

Word 无法启动转换器 mswrd632.wpc 错误

问题:您尝试打开一个 word 文档,它会产生消息

Word 无法启动转换器 mswrd632.wpc

documents conversion microsoft-word

5
推荐指数
1
解决办法
1万
查看次数

将word文档转换为图片

有没有办法将Word文档转换为图像?我想你可以打印屏幕,但这很痛苦。

documents capture images conversion microsoft-word

5
推荐指数
1
解决办法
1107
查看次数

高级语法和样式检查器

我刚刚完成了我的硕士论文的写作和复习;但是,我想知道是否有一种高级语法/风格工具可以通过我的论文并找出我遗漏的任何内容

编辑:

该工具不必是开源的,而是我正在寻找一个半可靠的高级语法(不是拼写检查器)检查器

software-rec documents english grammar styles

5
推荐指数
1
解决办法
1439
查看次数

是否有用于编辑 PDF 文本流的免费软件程序?

PDF 是一种很好的扫描图像存档格式,但 Acrobat 不允许您编辑文档的文本层(可以从中复制和粘贴的部分),只剩下原始 OCR。是否有任何免费软件替代品可以让您编辑文本图层?

pdf software-rec format documents archiving

5
推荐指数
1
解决办法
2728
查看次数

如何使用 OCR 用格式化文本替换 PDF 中的文本图像

我从其他人那里得到了很多由扫描的旧文档组成的 PDF。不幸的是,有时扫描件上的文字虽然清晰易读,但看起来颗粒状且难以阅读。

到目前为止,我能够做的是使用 OCR 将文本提取到 Word 文档中。然而,由于这些旧文档通常有插图和复杂的格式,我真正想做的就是删除旧的颗粒状文本并用计算机生成的字体替换它。换句话说,我想最大程度地保留 PDF 及其页面的格式,同时通过将其替换为“新罗马”来“清理”文本。

几天来,我一直在网上寻找一种简单、可自动化的方法来执行此类清理,但到目前为止我还没有找到任何东西。似乎应该有一种方法可以做到这一点,它似乎并不那么复杂,但也许我忽略了这个问题的某些方面,将其置于 OCR 目前可行的范围之外。

有什么建议?

pdf automation ocr documents

5
推荐指数
1
解决办法
3310
查看次数

使用非专有文件格式

我将要迁移到 Xubuntu;我有一个关于 docx 格式的问题。我有几百个专有的 docx 文件。我希望能够在不破坏格式并在 Office 中呈现不可读的情况下编辑它们。最好将这些转换为完全不同的格式吗?如果是这样,什么是支持丰富格式的好格式?可以在Office中使用吗?

open-source documents

5
推荐指数
2
解决办法
770
查看次数

如何每次以只读模式在共享驱动器上打开 Word 文档?

在 Office 2010 Pro 中有没有办法在我打开文档时始终以只读方式打开它?

在工作中,我们将文档存储在共享驱动器上。问题是,经常有人可能需要编辑它,但我打开它,因为我正在查看它。所以他们需要让我关闭它,以便他们可以编辑它。

documents shared-folders microsoft-office-2010 microsoft-word-2010

5
推荐指数
1
解决办法
1万
查看次数

如何使 PDF 中的所有页面大小相同?

我有一个不同大小页面的pdf。第一页是 579.275 x 402.547 点。其余页面为 612 x 792 pts(字母)。我想让所有的页面都是信纸大小。的输出pdfinfo -box -f 1 -l 10 A.pdf是:

$ pdfinfo -box -f 1 -l 10 A.pdf 
创建者:工具包 http://www.activepdf.com
制作人:Toolkit http://www.activepdf.com
创建日期:2012 年 2 月 4 日星期六 18:42:49
修改日期:2012 年 2 月 4 日星期六 18:42:49
标记: 没有
形式:AcroForm
页数:5
加密:否
第 1 页尺寸:579.275 x 402.547 pts
第 1 页腐烂:0
第 2 页尺寸:612 x 792 pts(信件)
第 2 页腐烂:0
第 3 页尺寸:612 x 792 pts(信件)
第 3 页腐烂:0
第 4 页尺寸:612 x 792 …

pdf documents ghostscript

5
推荐指数
1
解决办法
1万
查看次数

使用 ImageMagick 修剪外部空白空间不适用于扫描文档

给定一个图像,里面有一些实际的内容,通常有一些不需要的白色或黑色或透明度,我想使用 ImageMagick 修剪或裁剪外部部分。

以下图像是在计算机上以数字方式绘制的(在 HTML 上<canvas>):

画布.png

以下 ImageMagick 命令是我尝试过的:

$ convert canvas.png -trim +repage canvas_trimmed.png
Run Code Online (Sandbox Code Playgroud)

它工作得很好:

canvas_trimmed.png

所以这正是我想要的。但现在我希望它也适用于扫描文档,这些文档不像计算机生成的图像那样“完美”,即它们具有更多的“白色”和“黑色”阴影,并且没有更容易检测的透明度。有时,他们甚至会在纸张的白色背景周围出现一些黑条,因为扫描仪的区域比纸张大:

扫描.jpg

对于这张图片,我按照给定的顺序尝试了以下命令,每个命令都试图更加激进,但没有产生任何结果 - 您看不到原始图像和“修剪”图像之间的任何区别,即修剪或裁剪根本不起作用:

$ convert scan.jpg -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 10% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor white -border 1x1 -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor black -border 1x1 -trim +repage scan_trimmed.jpg
Run Code Online (Sandbox Code Playgroud)

我在这里做错了什么?如何修改能够可靠地修剪计算机生成图像的 ImageMagick 命令,使其能够同样可靠地修剪上述样式的扫描文档?

scanner scanning documents imagemagick image-manipulation

5
推荐指数
1
解决办法
3146
查看次数