在 Acrobat Reader 中,我可以转到文件 > 属性查看打开的 PDF 文件的所有元数据:创建文档的程序、作者信息、嵌入的字体等。
OS X 的预览也可以显示元数据,尽管是更有限的子集(在工具 > 显示检查器下)。但是,您无法通过预览查看嵌入的字体信息。
在 OS X 中有没有办法(最好使用预览,而不是使用 Acrobat)来查看 PDF 文件中嵌入了哪些字体?
我有一个带有矢量图像的 PDF 文件。(我从网上下载的,所以我没有任何原件。)
我希望提取矢量,以便我可以将它们叠加在其他一些图像上;在印刷媒体或网站上使用它们。
如何从 PDF 文件中提取特定矢量?
是否有任何软件可以从 PDF 文件中提取矢量?(最好是免费的。)
我收到了一份 Adobe PDF 扫描件,该文件显示颠倒。
我在 Adobe Acrobat 中旋转它并选择另存为创建一个新文档,但是旋转没有保存,当我打开新文档时,它又颠倒了。
如何将这个颠倒的文档更正为新的 PDF 文件?
我目前使用 Foxit 的 PDF 阅读器,最近我从互联网上下载了一张图片,但它在一个 PDF 文件中。如何提取此图像?
操作系统为 Windows 7。
我想打印一个 PDF,以便在第一页的正面是前两页,在背面是第 3 和第 4 页,依此类推。
----------------- -----------------
| | | | | |
| | | | | |
| 1 | 2 | | 3 | 4 | . . .
| | | | | |
|_______|_______| |_______|_______|
page 1 - front page 1 - back
Run Code Online (Sandbox Code Playgroud)
因为我使用 Linux 的打印机无法支持我想的手动双面打印,也许我可以以相应的方式编辑 pdf。
但是如何?
当我尝试使用 Imagemagick 合并两个 .pdf 文件时
convert pdf1.pdf pdf2.pdf temp.pdf
Run Code Online (Sandbox Code Playgroud)
生成的 temp.pdf 文件的分辨率似乎很低。如何保持与源文件中的分辨率相同?
我尝试了几个程序:pdftotext、pdf2txt.py、...所有这些程序都可以从 PDF 中提取文本,但是做得更好的一个是好的 ol' less:PDF 中的文本具有正确的布局。少怎么做这个?它使用任何库,还是内置的PDF处理?
我问是因为我想以编程方式使用这个功能,而不必像外部程序一样运行更少(我正在做 python)。
我的系统是:
» less --version
less 458 (GNU regular expressions)
Copyright (C) 1984-2012 Mark Nudelman
less comes with NO WARRANTY, to the extent permitted by law.
For information about the terms of redistribution,
see the file named README in the less distribution.
Homepage: http://www.greenwoodsoftware.com/less
» uname -a
Linux polyphemus 3.13.0-53-generic #89-Ubuntu SMP Wed May 20 10:34:39 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux
Run Code Online (Sandbox Code Playgroud) 由于我使用的是宽屏幕,因此我想在阅读 PDF 时全屏查看两页。我可以在阅读模式或普通视图中查看两页。然而,每当我切换到全屏模式时,acrobat 只显示一页。我想当您在 Adobe Acrobat 中处于全屏模式时,一定有某种方法可以查看两页吗?
我正在使用 Foxit PDF 阅读器来查看我的教科书。我想将 pdf 文件中的文本复制到 word 文档中,但它不会让我这样做。我可以很好地选择文本,但复制文本的选项不可用。我可以从其他文档中复制文本,但不能复制一些。有没有办法在 Windows 中绕过这种保护?
我有一本电子书,我想在 Kindle 上阅读 PDF 格式的电子书。不幸的是,页眉和页脚有一些内容(分别为页码和版权信息),阻止设备缩放实际文本以匹配其可用区域查看区域,从而使实际内容太小而无法阅读。
可以使用各种工具来去除空白,但 Kindle 已经这样做了;相比之下,我的目标是从定义的边界框外移除印刷品,我为此找到的唯一工具是价格适中的商业软件。
我可能可以在 Inkscape 中生成一个蒙版;使用 pdftk 拆分单个页面,将掩码单独应用于每个页面(输出到 postscript),然后将众多 postscript 文件重新组合成一个 PDF。然而,就文档大小而言,这种解码/重新编码步骤将是非常不幸的;能够以更巧妙的方式操作的东西将是理想的。
我拥有所有主要操作系统(Windows、几个现代 Linux 发行版、Mac 等),因此解决方案不需要受到平台的限制。
建议?
(我已经向作者报告了这个问题,他向他的编辑提到了这个问题,他在一个多月的时间里没有对这个问题做任何事情,这使得零工作方法显然没有成效)。
pdf ×10
conversion ×2
copy-paste ×1
extract ×1
fullscreen ×1
imagemagick ×1
images ×1
less ×1
linux ×1
preview ×1
processing ×1
resolution ×1
rotate ×1
windows-7 ×1