Chrome 不会保存 PDF 文件的“滚动状态”。
(尝试打开 PDF 文件,关闭选项卡,然后使用 重新打开它CtrlShiftT。或者在选择“设置”→“启动时”→“从上次停止的地方继续”后重新启动浏览器。)
我们如何才能启用这种行为?
有旗帜可以这样做吗?
有时我需要打印具有黑色背景或一些重背景图像的 pdf 文件,这会吸收大量墨水。有没有什么方法可以在打印前从 PDF 文件中去除背景?
任何适用于 Windows 或 Linux 的东西。
我有一本扫描书的PDF。
我正在寻找一个免费软件,该软件将执行 OCR,然后提供一个选项以将其再次保存为 PDF 或文档。
有吗?
我想为一台可以扫描到 PDF 的 Windows 机器找到一些简单的扫描软件,但我希望它可以将批处理或多页转换为一个大的 PDF。
我看到了几个关于扫描到 PDF 软件的问题,但没有看到任何关于扫描到大型多页 PDF 的内容。
编辑:我很惊讶没有更多的选择。许多扫描仪/多合一设备是否附带执行此功能的软件?
编辑 2:我尝试了 Scan2PDF,它在扫描作业中间多次锁定我,然后给我非英语错误消息。否则,我喜欢该应用程序的简单性,只需选择页数并点击“确定”即可。
还有其他成功案例吗?
当您复制文本(即使它们呈现正常)时,某些 PDF 文件会产生垃圾(“ mojibake ”)。这使得无法搜索它们(您搜索的任何内容都不会与垃圾匹配)。
有没有人有一个简单的解决方法?
例子:
我正在使用适用于 Windows 的 Adobe Reader(最新版本) - 也许其他查看器可能会有所帮助?我正在寻找适用于 Windows 的免费解决方案。开源会更好。
编辑:Multivalent Extract Text 工具的文档很好地总结了为什么会出错,包括:(引用的文档最后修改时间为 2006 年 1 月)
- 文本可能没有 Unicode 映射。PDF Type 3 字体通常没有,而 TeX DVI 具有没有 Unicode 等价物的字符。
- Unicode …
有大约 500 个 PDF 文件需要浏览并提取其中的第一页。然后他们需要经历一些耗时的转换过程,因此希望通过批处理从 500 个 pdf 中提取第一页并将其放入新的 pdf 中,从而节省一些时间。对 Acrobat 进行了一番探索,但找不到对多个文件执行此操作的真正方法。有谁知道可以实现的任何其他程序或方法?免费和开源显然更有利:)
编辑:实际上使用 GhostScript 仅提取一页取得了一些成功。我现在正在研究如何批处理并获取文件列表并使用它们。
我使用 Mac OS X 雪豹。我有一个包含表单域、注释和图章的 PDF。我想冻结(或“展平”)该 PDF,以便无法更改表单字段并且注释/图章不再可编辑。由于我实际上有很多这样的 PDF,我想在命令行上自动执行此操作。
我尝试/考虑过的一些事情,以及它们的成功程度:
pdftk与flatten选项一起使用。但这只会使表单字段变平,而不是邮票和其他注释。cupsfilter它可以从多种文件格式创建 PDF。像pdftk这样只压平了表单字段。cups-pdf挂接到Mac的打印服务器,并保存为PDF文件,而不是打印。我使用了macports 版本。生成的文件是扁平的但很大。我在一个 8MB 的文件上试过这个;扁平化的 PDF 是 358MB!也许这可以与Ubuntu Tip:Howto reduce PDF file size from command line 中的 ghostscript 调用结合使用。任何其他建议将不胜感激。
当我打开某个 PDF 文件时,出现以下错误:
For the best experience, open this PDF portfolio in
Acrobat X or Adobe Reader X, or later.
Get Adobe Reader Now!
Run Code Online (Sandbox Code Playgroud)
我有 Foxit Reader 5.1.4 和 Adobe Reader 8.3.1。除了此错误消息外,它们都不会打开它。简短的 google-ing 显示版本 9 可能会发生类似的事情。
For the best experience, open this PDF portfolio in
Acrobat 9 or Adobe Reader 9, or later.
Run Code Online (Sandbox Code Playgroud)
显然,Adobe 以他们的智慧发明了一种不向后兼容的新格式,并且有人以非向后兼容模式保存了此文档。为他们做的漂亮。理论上非常适合 Adobe,但
所以现在我完全反对获得新版本,或者完全反对使用 Adobe Acrobat。好动Adobe。
有没有另一种方法可以将其转换为我可以阅读的内容?我的第一个想法是找到拥有 Adobe Acrobat X 的人,让他们打开它,然后以向后兼容的格式保存它。但是我宁愿不涉及其他人,我希望下次发生这种情况时我可以自己做一些事情。
我尝试上传到 Google Docs,看看他们是否会神奇地解析文档,以便我可以以网络格式阅读它。这有相同的结果,愚蠢的消息/广告。
由于这不是我必须拥有的东西,如果没有 X 版本我无法阅读它,我就没有它。
我需要从 PDF 中获取数千个文本片段到电子表格。它们很短,很少超过 2-3 行,但是每次换行都会创建一个新单元格,我必须手动修复它,这会花费很多时间。
因为我有这么多,使用“粘贴到 Word 中并执行查找和替换”的解决方法对我来说太浪费时间了。有没有办法让换行符在复制时消失?也许有一个查看器为此提供了特殊的复制模式,或者有一个插件?
这些文件是科学文章。文字排列相当线性。您可以假设我正在复制的文本不在表格或浮点数内,也没有旋转或任何东西。(如果发生这样的事情,我想我会手动处理)。文本通常设置在两列中,但我可以毫不费力地从其列中标记我需要的文本。我不需要保留任何特殊格式。例如,我愿意尝试一种删除所有不可打印字符的解决方案。文本是英文的,如果解决方案仅适用于 ASCII/剥离复制文本的所有非字母数字 ASCII,则可以。
我非常喜欢可以在 Linux 上运行的解决方案,可能是某种 Okular 插件。但是,如果碰巧有仅适用于 Windows 的解决方案,我也想听听。我在 Windows 机器上有一个最近的 Acrobat Pro 的许可证。
我们办公室有一台打印机,可以从 U 盘打印 PDF 文件。它可以打印大多数文件,但有些文件存在问题,尤其是使用 Latex 生成的文件。有些 PDF 只是拒绝打印,有些 PDF 使用 courier-type 字体打印,而有些 PDF 打印得很好,除了方程式。
我正在寻找一种方法将 PDF“提炼”成一种绝对可靠的格式进行打印。通过将 PDF 简化/规范化到任何渲染器都可以正确渲染它的程度,或者简单地使每个页面成为 PDF 中的 600dpi 光栅图像。(我可以将 PDF 拆分为单独的光栅图像并手动组合它们,但我想要一些可编写脚本的内容。)
输出文件大小无所谓,只要确定打印,有A4纸大小(或原件)和300~600dpi分辨率即可。
pdf ×10
linux ×2
printing ×2
software-rec ×2
copy-paste ×1
file-format ×1
macos ×1
ocr ×1
open-source ×1
scanning ×1
search ×1
windows ×1