我知道pdftk.exe
可以指示PDF使用哪些字体的实用程序,以及它们是否嵌入.
现在的问题是:鉴于我有嵌入字体的PDF文件 - 如何以可重复使用的常规字体文件的形式提取这些字体?是否有(最好是免费的)工具可以做到这一点?另外:这可以用iText以编程方式完成吗?
任何人都可以推荐一个库/ API来从PDF中提取文本和图像吗?我们需要能够获得包含在文档的预先知道区域中的文本,因此API需要向我们提供页面上每个元素的位置信息.
我们希望以数据xml
或json
格式输出数据.我们目前正在寻找看起来相当不错的PdfTextStream,但希望听到其他人的经验和建议.
是否有以编程方式从pdf中提取文本的替代品(商业或免费)?
我正在尝试将PDF转换为PNG图像(至少是一个封面).我用pdftk成功地提取了PDF的第一页.我正在使用imagemagick进行转换:
convert cover.pdf cover.png
Run Code Online (Sandbox Code Playgroud)
这很有效,但不幸的是,cover.png通过错误渲染(PDF中的某些alpha对象无法正确呈现).我知道ImageMagick使用GhostScript进行转换,如果我直接使用gs我可以得到所需的结果,但我宁愿使用转换库,因为它有其他我想要利用的工具.
GhostScript中的此命令可完成所需的图像:
gs -sDEVICE=pngalpha -sOutputFile=cover.png -r144 cover.pdf
Run Code Online (Sandbox Code Playgroud)
我想知道有没有办法通过转换为GhostScript传递参数,还是我坚持直接调用GhostScript?
我找到了这个简洁的命令,使用Ghostscript将多个PDF合并为一个:
gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=out.pdf in1.pdf in2.pdf
Run Code Online (Sandbox Code Playgroud)
结果大小小于2个PDF的总大小.
使用单个文件作为输入运行命令仍会产生较小的输出文件.
Ghostscript上是否有一个选项可以复制页面,因为它们在合并时出现而不进行任何压缩?
如果没有,Ghostscript压缩是否可能如此之好以至于绝对不会导致质量下降?
如果要优化PDF文件并减小文件大小,Ghostscript是最佳选择吗?
我需要存储很多PDF文件,因此我需要尽可能地优化和减小文件大小
有没有人有Ghostscript和/或其他的经验?
exec('gs -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dCompatibilityLevel=1.4
-dPDFSETTINGS=/screen -sOutputFile='.$file_new.' '.$file);
Run Code Online (Sandbox Code Playgroud) 请忍受我的新手问题..
我试图使用ghostscript,ASP.NET和C#将PDF转换为PNG.但是,我还读到ghostscript不是线程安全的.所以我的问题是:
"ghostscript不是线程安全"究竟是什么意思?如果我在一个实时ASP.NET(aspx)Web应用程序中使用它,并且许多并发用户同时访问它,它会产生什么影响?
我还从另一个网站上读到了ghostscript ver的主要特征.8.63是多线程渲染.这是否意味着我们的线程安全问题现已解决?ghostscript线程现在安全吗?
我也正在评估来自PDFTron的PDF2Image,它应该是线程安全的.但每CPU许可证并不便宜.是否值得为"线程安全"和"不安全"支付额外的钱?
我想使用Ghostscript从PDF的一部分(使用坐标)中提取文本.
谁能帮我吗?
有没有办法使用ghostscript将PDF转换为PDF/A或PDF/X?我知道它可用于将PDF转换为图像,但我不知道它是否可用于转换PDF/A. 我应该使用什么参数?
我不是程序员,但想学习如何使用Ghostscript裁剪PDF.
我在我的机器上安装了Ghostscript 9.01.
请指导我一步一步的过程(从调用Ghostscript开始)来裁剪具有特定坐标的PDF.
我甚至是Ghostscript的新手.
我正在尝试缩放PDF,例如A4尺寸小到A4.
这适用于纵向文档.文档正确放大,然后填充添加到顶部.
在横向文档上,不添加填充.因此,文档最终将是A4的正确高度,但不够宽,因为文档方面没有添加填充(正如我所希望的那样).
这是我用它来处理A4肖像文档:
gs \
-sOutputFile=output.pdf \
-sDEVICE=pdfwrite \
-sPAPERSIZE=a4 \
-dCompatibilityLevel=1.4 \
-dNOPAUSE \
-dBATCH \
-dPDFFitPage \
input.pdf
Run Code Online (Sandbox Code Playgroud)