标签: ghostscript

如何从PDF中提取嵌入字体作为有效字体文件?

我知道pdftk.exe可以指示PDF使用哪些字体的实用程序,以及它们是否嵌入.

现在的问题是:鉴于我有嵌入字体的PDF文件 - 如何以可重复使用的常规字体文件的形式提取这些字体?是否有(最好是免费的)工具可以做到这一点?另外:这可以用iText以编程方式完成吗?

pdf fonts truetype ghostscript embedded-fonts

152
推荐指数
5
解决办法
24万
查看次数

如何从PDF中提取文本?

任何人都可以推荐一个库/ API来从PDF中提取文本和图像吗?我们需要能够获得包含在文档的预先知道区域中的文本,因此API需要向我们提供页面上每个元素的位置信息.

我们希望以数据xmljson格式输出数据.我们目前正在寻找看起来相当不错的PdfTextStream,但希望听到其他人的经验和建议.

是否有以编程方式从pdf中提取文本的替代品(商业或免费)?

pdf text text-extraction ghostscript extraction

141
推荐指数
10
解决办法
23万
查看次数

将PDF转换为PNG

我正在尝试将PDF转换为PNG图像(至少是一个封面).我用pdftk成功地提取了PDF的第一页.我正在使用imagemagick进行转换:

convert cover.pdf cover.png
Run Code Online (Sandbox Code Playgroud)

这很有效,但不幸的是,cover.png通过错误渲染(PDF中的某些alpha对象无法正确呈现).我知道ImageMagick使用GhostScript进行转换,如果我直接使用gs我可以得到所需的结果,但我宁愿使用转换库,因为它有其他我想要利用的工具.

GhostScript中的此命令可完成所需的图像:

gs -sDEVICE=pngalpha -sOutputFile=cover.png -r144 cover.pdf
Run Code Online (Sandbox Code Playgroud)

我想知道有没有办法通过转换为GhostScript传递参数,还是我坚持直接调用GhostScript?

pdf png image imagemagick ghostscript

76
推荐指数
5
解决办法
9万
查看次数

Ghostscript合并PDF压缩结果

我找到了这个简洁的命令,使用Ghostscript将多个PDF合并为一个:

gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=out.pdf in1.pdf in2.pdf
Run Code Online (Sandbox Code Playgroud)

结果大小小于2个PDF的总大小.

使用单个文件作为输入运行命令仍会产生较小的输出文件.

Ghostscript上是否有一个选项可以复制页面,因为它们在合并时出现而不进行任何压缩?

如果没有,Ghostscript压缩是否可能如此之好以至于绝对不会导致质量下降?

pdf ghostscript

63
推荐指数
2
解决办法
6万
查看次数

优化PDF文件(使用Ghostscript或其他)

如果要优化PDF文件并减小文件大小,Ghostscript是最佳选择吗?

我需要存储很多PDF文件,因此我需要尽可能地优化和减小文件大小

有没有人有Ghostscript和/或其他的经验?

命令行

exec('gs -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dCompatibilityLevel=1.4
-dPDFSETTINGS=/screen -sOutputFile='.$file_new.' '.$file);
Run Code Online (Sandbox Code Playgroud)

linux pdf debian ghostscript

49
推荐指数
4
解决办法
6万
查看次数

什么"线程安全"真正意味着......在实践中

请忍受我的新手问题..

我试图使用ghostscript,ASP.NET和C#将PDF转换为PNG.但是,我还读到ghostscript不是线程安全的.所以我的问题是:

  1. "ghostscript不是线程安全"究竟是什么意思?如果我在一个实时ASP.NET(aspx)Web应用程序中使用它,并且许多并发用户同时访问它,它会产生什么影响?

  2. 我还从另一个网站上读到了ghostscript ver的主要特征.8.63是多线程渲染.这是否意味着我们的线程安全问题现已解决?ghostscript线程现在安全吗?

  3. 我也正在评估来自PDFTron的PDF2Image,它应该是线程安全的.但每CPU许可证并不便宜.是否值得为"线程安全"和"不安全"支付额外的钱?

c# asp.net multithreading ghostscript thread-safety

43
推荐指数
4
解决办法
1万
查看次数

带坐标的PDF文本提取

我想使用Ghostscript从PDF的一部分(使用坐标)中提取文本.

谁能帮我吗?

pdf text-extraction ghostscript

42
推荐指数
1
解决办法
6万
查看次数

如何使用ghostscript将PDF转换为PDF/A或PDF/X?

有没有办法使用ghostscript将PDF转换为PDF/A或PDF/X?我知道它可用于将PDF转换为图像,但我不知道它是否可用于转换PDF/A. 我应该使用什么参数?

pdf ghostscript pdfa

40
推荐指数
4
解决办法
5万
查看次数

使用Ghostscript 9.01裁剪PDF

我不是程序员,但想学习如何使用Ghostscript裁剪PDF.

我在我的机器上安装了Ghostscript 9.01.

请指导我一步一步的过程(从调用Ghostscript开始)来裁剪具有特定坐标的PDF.

我甚至是Ghostscript的新手.

pdf crop ghostscript

37
推荐指数
1
解决办法
4万
查看次数

使用Ghostscript调整PDF大小

我正在尝试缩放PDF,例如A4尺寸小到A4.

这适用于纵向文档.文档正确放大,然后填充添加到顶部.

在横向文档上,不添加填充.因此,文档最终将是A4的正确高度,但不够宽,因为文档方面没有添加填充(正如我所希望的那样).

这是我用它来处理A4肖像文档:

gs \
 -sOutputFile=output.pdf \
 -sDEVICE=pdfwrite \
 -sPAPERSIZE=a4 \
 -dCompatibilityLevel=1.4 \
 -dNOPAUSE \
 -dBATCH \
 -dPDFFitPage \
  input.pdf
Run Code Online (Sandbox Code Playgroud)

pdf resize ghostscript page-size

37
推荐指数
4
解决办法
5万
查看次数