标签: pdf

如何在 Chrome 中保存 PDF 文件的“滚动状态”?

Chrome 不会保存 PDF 文件的“滚动状态”。

(尝试打开 PDF 文件,关闭选项卡,然后使用 重新打开它CtrlShiftT。或者在选择“设置”→“启动时”→“从上次停止的地方继续”后重新启动浏览器。)

我们如何才能启用这种行为?

有旗帜可以这样做吗?

pdf google-chrome

20
推荐指数
1
解决办法
9166
查看次数

打印没有背景的PDF文件

有时我需要打印具有黑色背景或一些重背景图像的 pdf 文件,这会吸收大量墨水。有没有什么方法可以在打印前从 PDF 文件中去除背景?

任何适用于 Windows 或 Linux 的东西。

pdf printing

20
推荐指数
1
解决办法
12万
查看次数

如何将扫描的图像作为 PDF 转换为可搜索的 PDF 文件?

我有一本扫描书的PDF。

我正在寻找一个免费软件,该软件将执行 OCR,然后提供一个选项以将其再次保存为 PDF 或文档。

有吗?

pdf software-rec ocr

19
推荐指数
2
解决办法
4万
查看次数

寻找简单的 Windows 扫描(多页)到一个 PDF 应用程序?

我想为一台可以扫描到 PDF 的 Windows 机器找到一些简单的扫描软件,但我希望它可以将批处理或多页转换为一个大的 PDF。

我看到了几个关于扫描到 PDF 软件的问题,但没有看到任何关于扫描到大型多页 PDF 的内容。

编辑:我很惊讶没有更多的选择。许多扫描仪/多合一设备是否附带执行此功能的软件?

编辑 2:我尝试了 Scan2PDF,它在扫描作业中间多次锁定我,然后给我非英语错误消息。否则,我喜欢该应用程序的简单性,只需选择页数并点击“确定”即可。

还有其他成功案例吗?

windows pdf software-rec scanning

19
推荐指数
2
解决办法
3万
查看次数

使用非标准字符编码搜索 PDF

当您复制文本(即使它们呈现正常)时,某些 PDF 文件会产生垃圾(“ mojibake ”)。这使得无法搜索它们(您搜索的任何内容都不会与垃圾匹配)。

有没有人有一个简单的解决方法?

例子:

  1. TEAC TV 手册 EU2816STF(在 Windows 和 Mac 上的 Adob​​e Reader 中产生上述问题,但在 Mac 上的预览中工作正常)
  2. Leadtek Winfast PVR2 手册(FTP 链接;在 Mac 上预览也有问题)
  3. Swann TV 调谐器卡手册(FTP 链接;在 Mac 上预览也有问题)
  4. Phonedisc 许可协议(来自现已解散的DTMS
  5. 麦格理 IFP 季度基金回顾
  6. BAN-TACS 小型企业手册(存档版)
  7. 2004 年复活节传单(也来自档案)

我正在使用适用于 Windows 的 Adob​​e Reader(最新版本) - 也许其他查看器可能会有所帮助?我正在寻找适用于 Windows 的免费解决方案。开源会更好。

编辑:Multivalent Extract Text 工具的文档很好地总结了为什么会出错,包括:(引用的文档最后修改时间为 2006 年 1 月)

  • 文本可能没有 Unicode 映射。PDF Type 3 字体通常没有,而 TeX DVI 具有没有 Unicode 等价物的字符。
  • Unicode …

search pdf character-encoding

19
推荐指数
1
解决办法
1万
查看次数

从多个pdf中提取第一页

有大约 500 个 PDF 文件需要浏览并提取其中的第一页。然后他们需要经历一些耗时的转换过程,因此希望通过批处理从 500 个 pdf 中提取第一页并将其放入新的 pdf 中,从而节省一些时间。对 Acrobat 进行了一番探索,但找不到对多个文件执行此操作的真正方法。有谁知道可以实现的任何其他程序或方法?免费和开源显然更有利:)

编辑:实际上使用 GhostScript 仅提取一页取得了一些成功。我现在正在研究如何批处理并获取文件列表并使用它们。

pdf open-source

19
推荐指数
1
解决办法
2万
查看次数

如何在命令行中在 Mac OS 中完全展平 PDF?

我使用 Mac OS X 雪豹。我有一个包含表单域、注释和图章的 PDF。我想冻结(或“展平”)该 PDF,以便无法更改表单字段并且注释/图章不再可编辑。由于我实际上有很多这样的 PDF,我想在命令行上自动执行此操作。

我尝试/考虑过的一些事情,以及它们的成功程度:

  • 在预览中打开并打印到文件。这将创建一个完全平面的 PDF,而不会更改文件大小。不过,自动化的唯一方法似乎是编写一个笨拙的基于 UI 的 AppleScript,但我一直试图避免这种情况。
  • 在 Acrobat Pro 中打开并使用JavaScript 函数将. 同样,不确定如何在命令行上自动执行此操作。
  • pdftkflatten选项一起使用。但这只会使表单字段变平,而不是邮票和其他注释。
  • 使用cupsfilter它可以从多种文件格式创建 PDF。像pdftk这样只压平了表单字段。
  • 使用cups-pdf挂接到Mac的打印服务器,并保存为PDF文件,而不是打印。我使用了macports 版本。生成的文件是扁平的但很大。我在一个 8MB 的文件上试过这个;扁平化的 PDF 是 358MB!也许这可以与Ubuntu Tip:Howto reduce PDF file size from command line 中的 ghostscript 调用结合使用。

任何其他建议将不胜感激。

pdf macos

19
推荐指数
3
解决办法
2万
查看次数

如何在没有最新版本的情况下打开“Acrobat X”文档?

当我打开某个 PDF 文件时,出现以下错误:

For the best experience, open this PDF portfolio in 
Acrobat  X or Adobe Reader  X, or later.

Get Adobe Reader Now!
Run Code Online (Sandbox Code Playgroud)

我有 Foxit Reader 5.1.4 和 Adob​​e Reader 8.3.1。除了此错误消息外,它们都不会打开它。简短的 google-ing 显示版本 9 可能会发生类似的事情。

For the best experience, open this PDF portfolio in
Acrobat 9 or Adobe Reader 9, or later.
Run Code Online (Sandbox Code Playgroud)

显然,Adobe 以他们的智慧发明了一种不向后兼容的新格式,并且有人以非向后兼容模式保存了此文档。为他们做的漂亮。理论上非常适合 Adob​​e,但

  1. 不想获得新版本的 Adob​​e。
  2. 我确实尝试下载它,但我没有更好的判断。安装程序已下载。我跑了。它未能完成,并自行删除,所以我不能再试一次。

所以现在我完全反对获得新版本,或者完全反对使用 Adob​​e Acrobat。好动Adobe。

有没有另一种方法可以将其转换为我可以阅读的内容?我的第一个想法是找到拥有 Adob​​e Acrobat X 的人,让他们打开它,然后以向后兼容的格式保存它。但是我宁愿不涉及其他人,我希望下次发生这种情况时我可以自己做一些事情。

我尝试上传到 Google Docs,看看他们是否会神奇地解析文档,以便我可以以网络格式阅读它。这有相同的结果,愚蠢的消息/广告。

由于这不是我必须拥有的东西,如果没有 X 版本我无法阅读它,我就没有它。

pdf file-format

19
推荐指数
3
解决办法
1万
查看次数

有没有一种有效的方法可以在没有换行符的情况下从 PDF 复制文本?

我需要从 PDF 中获取数千个文本片段到电子表格。它们很短,很少超过 2-3 行,但是每次换行都会创建一个新单元格,我必须手动修复它,这会花费很多时间。

因为我有这么多,使用“粘贴到 Word 中并执行查找和替换”的解决方法对我来说太浪费时间了。有没有办法让换行符在复制时消失?也许有一个查看器为此提供了特殊的复制模式,或者有一个插件?

这些文件是科学文章。文字排列相当线性。您可以假设我正在复制的文本不在表格或浮点数内,也没有旋转或任何东西。(如果发生这样的事情,我想我会手动处理)。文本通常设置在两列中,但我可以毫不费力地从其列中标记我需要的文本。我不需要保留任何特殊格式。例如,我愿意尝试一种删除所有不可打印字符的解决方案。文本是英文的,如果解决方案仅适用于 ASCII/剥离复制文本的所有非字母数字 ASCII,则可以。

我非常喜欢可以在 Linux 上运行的解决方案,可能是某种 Okular 插件。但是,如果碰巧有仅适用于 Windows 的解决方案,我也想听听。我在 Windows 机器上有一个最近的 Acrobat Pro 的许可证。

linux pdf copy-paste microsoft-excel

19
推荐指数
2
解决办法
2万
查看次数

如何在 Linux 中提取/光栅化 PDF

我们办公室有一台打印机,可以从 U 盘打印 PDF 文件。它可以打印大多数文件,但有些文件存在问题,尤其是使用 Latex 生成的文件。有些 PDF 只是拒绝打印,有些 PDF 使用 courier-type 字体打印,而有些 PDF 打印得很好,除了方程式。

我正在寻找一种方法将 PDF“提炼”成一种绝对可靠的格式进行打印。通过将 PDF 简化/规范化到任何渲染器都可以正确渲染它的程度,或者简单地使每个页面成为 PDF 中的 600dpi 光栅图像。(我可以将 PDF 拆分为单独的光栅图像并手动组合它们,但我想要一些可编写脚本的内容。)

输出文件大小无所谓,只要确定打印,有A4纸大小(或原件)和300~600dpi分辨率即可。

linux pdf printing

19
推荐指数
2
解决办法
8593
查看次数