有没有人有任何修复损坏的 PDF 的建议或程序?当我打开文件时,我收到“打开此文档时出错。文件已损坏,无法修复。” 那里似乎有无数的工具,但没有一个我可以形容为有信誉的。是否有任何基于开源 linux 的解决方案?
有谁知道将 pdf 的页面从中间拆分成两个新页面的好方法吗?
需要明确的是,我并不是要从 pdf 中分离出已经存在的页面;我正在尝试从现有的单个页面创建两个新页面。
我有一个已经压缩过的 PDF 和一些人工图像,我正在使用 Ghostscript 为该 PDF 添加一个标题页。
但是,我找不到任何方法告诉 GS 按原样使用现有图像而不重新处理它们,现在我觉得这与 GS 的工作方式有关,即您无法重新编译/链接 PDF没有重新处理它的图像..是真的吗?
我可以在 GS 中提高 DPI 设置,但它会从 5MB 增加到 60MB,同时看起来仍然更糟。
有没有更好的替代 GS 可以满足我的需要(最好是在 OS X 上编译)?
类似于这个问题:
我有一个 PDF 文档,想将其转换为纯黑白。所以我想丢弃半色调。要使用 ghostscript 转换为灰度,我可以使用以下命令:
gs \
-sOutputFile=output.PDF \
-sDEVICE=pdfwrite \
-sColorConversionStrategy=Gray \
-dProcessColorModel=/DeviceGray \
-dCompatibilityLevel=1.4 \
input.PDF < /dev/null
Run Code Online (Sandbox Code Playgroud)
我必须改变什么才能获得单色,例如只有黑色和白色,没有半色调?
将各种语法高亮的源文件(C、SQL、Java、PHP、batch、bash)批量转换为高分辨率图像(600dpi),适用于电子书和印刷书籍。
到目前为止的一些尝试:
font标签。html2ps。几乎有效的解决方案是:
如何轻松地从文件夹中的所有 PDF 中删除所有评论和注释(使用 Foxit Reader 添加)?
例如,我知道有一个 Ghostscript 选项-dPDFSETTINGS=/screen- 记录在哪里?我怎样才能看到它接受的其他选项,从screen?另外,-dMaxSubsetPct=100- 它有什么作用?
我打开man gs,搜索PDFSET,我得到“找不到模式”。我在搜索引擎中输入,我得到了无数的个人网页,没有找到任何文档。
谁能帮忙给个链接?
编辑:另请参阅此相关帖子:
查询 Ghostscript 以获取输出设备的默认选项/设置(例如“pdfwrite”或“tiffg4”) - VoidCC
... 获取给定设备支持的选项列表。
我知道 Ghostscript 可以将 PDF 转换为 JPG,在多页 PDF 的情况下,可以将每个页面翻录为单个 JPG。但是是否可以将它们撕成一个 JPG,以便将页面相互粘贴,例如 JPG 的上半部分是第 1 页,下半部分是第 2 页?或者我是否必须使用另一个程序(ImageMagick 可以这样做吗?)将 JPG 页面组合成一个图像?
我有一堆 PDF 文件,其中包含两个“真实”页面到一个 PDF 页面;我想把它们切成两半,然后把每一半放在单独的一页上。本质上,我需要一些与pdfnup(or psnup)完全相反的东西。如何实现这一壮举?
平台为Linux,开源优先;因为我有一大堆这些来做一些可以编写脚本的东西(而不是 GUI)会很好,所以我可以给它一个它们的列表并让它咀嚼。
预先存在的脚本也不是唯一的选择;如果有使用第三方库以类似方式操作 PDF 的示例代码,我可能可以将其破解为做我想做的事。
此 PDF 由 Abbyy Finereader 10 制作:
http://ebooks.zeitr.org/from_abbyy.pdf
您可以复制并粘贴第一句话并获得此(非常好的)文本结果:
Der »Bund Deutscher Gymnastik-Schulleiter« wurde am 20. November 1955 anläßlich einer Zusammenkunft der Leiterinnen und Leiter der privaten deutschen Gymnastik-Ausbildungsstätten gegründet。
在使用 Ghostscript 9.02(64 位 Windows)进行一些处理后,我得到了这个文件:
http://ebooks.zeitr.org/after_ghostscript.pdf
现在第一句话看起来很奇怪 - 每个单词的最后一个字符之前都有一个额外的空格。
Der »Bun d Deutscher r GymnastikSchulleiter « wurd eam 20 . 195 年 11 月 5 月
这有一个主要的负面影响,即您无法在 Acrobat Reader 中搜索整个单词。我可以使用以下为 Ghostscript 设置的最小参数来重现效果:
-sDEVICE=pdfwrite ^
-dBATCH ^
-dNOPAUSE ^
-sstdout="myStdOut" ^
-sOutputFile="myDestFile.pdf" ^
mySourceFile.pdf
Run Code Online (Sandbox Code Playgroud)
有任何想法吗?
ghostscript ×10
pdf ×9
linux ×3
command-line ×2
imagemagick ×2
batch ×1
conversion ×1
gvim ×1
ocr ×1
pdftk ×1
repair ×1