我有一个 pdf 文件,我想知道我是否可以将其所有字体嵌入/子集到 PDF 文件本身中?有没有支持这个操作的工具?
我正在使用convert(Imagemagick 组件,在后台委托给 Ghostscript)将 PDF 文件的第一页转换为图像。
通常,convert -density 200 file.pdf[0] first_page.png它将完成这项工作,它会以每英寸纸张 200 像素的速度对 PDF 文件进行采样。
但是,很少发生某些 PDF 异常巨大的情况(有时是 A0 纸,最近是页面超过 23 平方米(长 183 英寸,宽 185 英寸)的 PDF。
对于这样的文件,convert会挂掉,吃CPU时间。宽度和高度超过 35000 像素的图像根本无法使用。
因此问题是:Imagemagick 中是否有一个开关可以使密度适应页面大小,或者至少指定我们不想采样超过 PDF 文件最大区域的一部分(左上角,30x30 英寸)例如)?
谢谢。
编辑:在其官方 git 存储库中,MuPDF添加了-w和-h开关,与-r将在这里执行所需的操作。
我有一个由 N 页组成的 PDF。我想将此 PDF 转换为 N 个 jpeg 图像(通过命令行,没有 Php、Java 或其他编程语言)。
我正在尝试使用 GHOSTSCRIPT 来做到这一点,但是 GS 给我的输出永远不会像我正在寻找的输出。
例子:
gs \
-sDEVICE=jpeg \
-dNOCACHE \
-dDEVICEHEIGHTPOINTS=72 -dDEVICEWIDTHPOINTS=72 \
-r300 \
-g800x600 \
-dFIXEDMEDIA \
-dPDFFitPage \
-sOutputFile=output/%d.jpg \
mypdf.pdf
Run Code Online (Sandbox Code Playgroud)
生成 N 个 800x600 分辨率的 jpeg 图像,但似乎 PDF 页面被裁剪而不适合。
我怎样才能从 N 页 PDF(从命令行)中获得 N 个 jpeg 图像?
我有一个不同大小页面的pdf。第一页是 579.275 x 402.547 点。其余页面为 612 x 792 pts(字母)。我想让所有的页面都是信纸大小。的输出pdfinfo -box -f 1 -l 10 A.pdf是:
$ pdfinfo -box -f 1 -l 10 A.pdf 创建者:工具包 http://www.activepdf.com 制作人:Toolkit http://www.activepdf.com 创建日期:2012 年 2 月 4 日星期六 18:42:49 修改日期:2012 年 2 月 4 日星期六 18:42:49 标记: 没有 形式:AcroForm 页数:5 加密:否 第 1 页尺寸:579.275 x 402.547 pts 第 1 页腐烂:0 第 2 页尺寸:612 x 792 pts(信件) 第 2 页腐烂:0 第 3 页尺寸:612 x 792 pts(信件) 第 3 页腐烂:0 第 4 页尺寸:612 x 792 …
我正在开发一个“无纸化”工作流程,并计划以 PDF/A-1b 格式保存所有文件。
我正在尝试开发一个简单的批处理文件,用于将我创建或接收的 PDF 文件转换为 PDF/A-1b。从这个答案开始,我有以下批处理文件:
gswin32c ^
-dPDFA ^
-dNOOUTERSAVE ^
-sProcessColorModel=DeviceCMYK ^
-dUseCIEColor ^
-sDEVICE=pdfwrite ^
-o %2 ^
-dPDFACompatibilityPolicy=1 ^
"C:\Program Files (x86)\gs\gs9.07\mylib\PDFA_def.ps" ^
%1
Run Code Online (Sandbox Code Playgroud)
在 PDFA_def.ps 中,我尝试了几种不同的 ICC 配置文件,包括我在系统上找到的一个
C:/Windows/System32/spool/drivers/color/CalibratedDisplayProfile-5.icc
Run Code Online (Sandbox Code Playgroud)
和sRGB_IEC61966-2-1_no_black_scaling.icc来自color.org。
我的测试输入文件是使用CutePDF 2.8(使用Ghostscript 8.15)从Microsoft Outlook 2010 打印的一页电子邮件。
使用我的批处理文件和 Ghostscript 9.07 进行转换后,Adobe Reader 认为输出是 PDF/A,但pdf-tools.com 的PDF/A-1b 验证失败并显示消息“密钥 N 的值是 4 但必须是 3 .”
我已经将其追溯到 PDF 输出文件中的以下结构:
<</Filter/FlateDecode
/N 4/Length 2595>>stream
Run Code Online (Sandbox Code Playgroud)
如果我更改/N 4为/N 3,“键 N …
我正在尝试找到一种使用 pdfcreator 创建 PDF 并将 PDF Producer 设置为 ghostscript v* 以外的内容的方法。
由于某些奇怪的原因,我将 Pdf 文件传送到的程序只接受佳能生成的 PDF 文件。
我认为可能有某种我可以传递的 ghostscript 参数,但没有发现任何明显的东西。我什至考虑将 pdf 传递给 vbscript 以修改该属性,但我不会立即看到我可以创建的任何对象来修改它。
任何想法或方向将不胜感激。
我正在尝试在我的网络服务器上安装 Ghostscript,但网站上的说明似乎对我不起作用。
我已登录到我的 ssh 终端。
我输入:
wget http://downloads.ghostscript.com/public/binaries/ghostscript-9.18-linux-x86_64.tgz
Run Code Online (Sandbox Code Playgroud)
然后:
tar -zxvf ghostscript-9.18-linux-x86_64.tgz
cd ghostscript-9.18-linux-x86_64
Run Code Online (Sandbox Code Playgroud)
然后文档说我只需要运行./configure,但这似乎没有任何作用。里面有一个可执行文件,但是当我运行它时,它只会将我带到 Ghostscript 提示符而不是安装 Ghostscript。
我是新手,所以保持简单。
我有一个包含地图的大型 PDF 文件。PDF 文件可能是用 AutoCAD 生成的。
该图像由彩色光栅地图和地图顶部带有线条的矢量组成。(街道等)
我需要分别处理栅格和矢量。当我将其导入 photoshop 时,它只能看到一层。当我在 Adobe PDF Reader 上选择图层选项卡时,它也只显示一个图层。但我确定有多个图层,因为在渲染文件时,它首先在背景中绘制地图,然后才开始在顶部绘制矢量。如果我足够快,我实际上可以使用“打印屏幕”来保存背景光栅。我需要一种更可靠的方法来提取该图像以及矢量。
我可以使用诸如 ghostscript 之类的开源工具将 pdf 分成其基本部分,如文本、光栅、矢量数据吗?然后他们把它们都放在一个文件夹里?
我有很多 PDF,需要将单个页面从 TIFF 转换为 TIFF。Acrobat 会让我对所有页面进行批处理,但这会占用太多空间。
有没有办法做到这一点?
我正在使用以下 Ghostscript 命令打印 postscript 文档:
C:\Program Files\gs\gs9.14\bin>gswin64c.exe -sDEVICE=mswinpr2 testprinter.ps
Run Code Online (Sandbox Code Playgroud)
此命令将打开一个打印对话框,我可以在其中更改打印机、指定打印范围和份数,以及使用确定和取消按钮。
但是,我的要求是让 Ghostscript 只是静默打印以抑制打印对话框。
是否有一个命令开关可以让我静默打印?所以我可以发出命令,打印机打印出来。
我无法从 Google 或互联网上提供的其他各种 Ghostscript 文档中获取任何信息。所以我想与友好且知识渊博的超级用户社区核实一下。
ghostscript ×10
pdf ×8
adobe-reader ×1
conversion ×1
cutepdf ×1
documents ×1
export ×1
imagemagick ×1
jpeg ×1
linux ×1
metadata ×1
pdf-reader ×1
print-to-pdf ×1
printer ×1
printing ×1
ps ×1
tiff ×1
vbscript ×1