我正在为客户创建一个安全的文档门户。他们担心的一件事是有人上传带有病毒的文档。一种可能有效的解决方案是强制他们只上传 pdf 文件。
我的问题有两个:
我正在寻找一种快速的在线/离线免费解决方案来更改 PDF 文件的页面顺序,例如将 PDF 的第 5 页更改为第 3 页。
我知道以前有人问过这个问题,但是我一直在尝试各种免费软件产品,因此我感到很困惑。我想摆脱 DiffDoc 部门。问题是我无法找到可以满足我们需要的东西。WinMerge 是最新的尝试。
问题很简单。一个 Word 和一个 PDF 文档,其中一部分包含要进行比较的文本。
比较它们并完成。原始文本,忽略空格,忽略回车等;并在某种报告中给我结果。
我们尝试了 ExamDiff、kdiff3、Tortoise 和其他一些。
我为一个客户制作了一些冗长的 PDF 文件,我想将其用作发送给另一个客户的样本。但是,PDF 中的文本具有商业敏感性,因此我不想按原样发送。
我想隐藏文本,以便文档仍然具有与原始文档相同的整体外观,但使用无意义的文本(lorem ipsum ...)或文本“希腊语”以致难以阅读。文档的所有其他部分应该保持不变,即我不想破坏艺术品等。
我知道 Acrobat 可以编辑文本 - 但这只是将其完全涂黑,使其看起来不再像文本。那不是我所追求的。我希望文档看起来像一个真实的文档 - 但不包含敏感材料。
有没有工具可以做到这一点?
假设我将一个 .tex 文件编译成 ps 和 pdf。pdf和ps的打印速度会有区别吗?
PDF 是一种很好的扫描图像存档格式,但 Acrobat 不允许您编辑文档的文本层(可以从中复制和粘贴的部分),只剩下原始 OCR。是否有任何免费软件替代品可以让您编辑文本图层?
我如何知道在创作、生成结果 PDF 文档时使用了什么软件?
例如 MS Word、latex/dvipdf、PDF Creator 等。PDF 能保存这些信息吗?
我从其他人那里得到了很多由扫描的旧文档组成的 PDF。不幸的是,有时扫描件上的文字虽然清晰易读,但看起来颗粒状且难以阅读。
到目前为止,我能够做的是使用 OCR 将文本提取到 Word 文档中。然而,由于这些旧文档通常有插图和复杂的格式,我真正想做的就是删除旧的颗粒状文本并用计算机生成的字体替换它。换句话说,我想最大程度地保留 PDF 及其页面的格式,同时通过将其替换为“新罗马”来“清理”文本。
几天来,我一直在网上寻找一种简单、可自动化的方法来执行此类清理,但到目前为止我还没有找到任何东西。似乎应该有一种方法可以做到这一点,它似乎并不那么复杂,但也许我忽略了这个问题的某些方面,将其置于 OCR 目前可行的范围之外。
有什么建议?
所以我想下载 Beej 的网络编程指南,可在此处获得。A4 大小的 PDF 有两个链接,一个用于“一面”,另一个用于“双面”。打印它们时应该有什么区别?
pdf ×10
documents ×2
archiving ×1
automation ×1
comparison ×1
conversion ×1
format ×1
ocr ×1
pdflatex ×1
postscript ×1
printing ×1
software-rec ×1
text-editing ×1