JBW*_*ore 306 pdf imagemagick
我正在尝试使用命令行程序convert将PDF转换为图像(JPEG或PNG).这是我试图转换的PDF之一.
我希望程序能够修剪多余的空白区域并返回足够高质量的图像,以便轻松读取上标.
这是我目前最好的尝试.正如你所看到的,修剪效果很好,我只需要提高分辨率.这是我正在使用的命令:
convert -trim 24.pdf -resize 500% -quality 100 -sharpen 0x1.0 24-11.jpg
Run Code Online (Sandbox Code Playgroud)
我试图做出以下有意识的决定:
-sharpen(我已尝试过一系列值)任何有关在最终PNG/JPEG中获得图像分辨率的建议都将非常感谢!
JBW*_*ore 370
似乎以下工作:
convert \
-verbose \
-density 150 \
-trim \
test.pdf \
-quality 100 \
-flatten \
-sharpen 0x1.0 \
24-18.jpg
Run Code Online (Sandbox Code Playgroud)

(要真正看到并欣赏两者之间的差异,请右键单击每个,然后选择"在新标签中打开图像...".)
还要记住以下事实:
所以,不需要调整大小; 添加-density标志.密度值150很奇怪 - 尝试一系列值会导致两个方向上看起来更糟糕的图像!
maj*_*ibu 143
我个人喜欢这个.
convert -density 300 -trim test.pdf -quality 100 test.jpg
Run Code Online (Sandbox Code Playgroud)
这是文件大小的两倍多,但对我来说看起来更好.
-density 300 设置呈现PDF的dpi.
-trim 删除与角点像素颜色相同的任何边缘像素.
-quality 100 将JPEG压缩质量设置为最高质量.
类似的东西-sharpen不适用于文本,因为它们会撤消字体渲染系统所做的事情,使其更清晰.
如果你真的希望它被炸毁,请在这里使用resize,并且可能会有更大的dpi值,比如targetDPI * scalingFactor 那将以你想要的分辨率/大小呈现PDF.
imagemagick.org上的参数说明在这里
Gab*_*les 20
我在convert[2020 年 5 月更新:实际上:它对我来说几乎从来没有用过] 方面确实没有取得很好的成功,但是我在pdftoppm. 以下是从 PDF 生成高质量图像的几个示例:
[每页生成约 25 MB 大小的文件] 将300 DPI 的未压缩.tif文件格式输出到名为“images”的文件夹中,文件名为pg-1.tif、pg-2.tif、pg-3.tif,等等:
mkdir -p images && pdftoppm -tiff -r 300 mypdf.pdf images/pg
Run Code Online (Sandbox Code Playgroud)
[每页产生约 1MB 大小的文件] 以.jpg格式以300 DPI输出:
mkdir -p images && pdftoppm -jpeg -r 300 mypdf.pdf images/pg
Run Code Online (Sandbox Code Playgroud)
[每页生成约 2MB 大小的文件] 以.jpg格式以最高质量(最少压缩)和300 DPI 输出:
mkdir -p images && pdftoppm -jpeg -jpegopt quality=100 -r 300 mypdf.pdf images/pg
Run Code Online (Sandbox Code Playgroud)
https://askubuntu.com/questions/150100/extracting-embedded-images-from-a-pdf/1187844#1187844。
pdf2searchablepdf] https://askubuntu.com/questions/473843/how-to-turn-a-pdf-into-a-text-searchable-pdf/1187881#1187881Val*_*rio 18
通常我用原始分辨率的'pdfimages'提取嵌入图像,然后使用ImageMagick转换为所需的格式:
$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName # save in .ppm format
$ convert fileName-000.ppm fileName-000.png
Run Code Online (Sandbox Code Playgroud)
这会生成最佳和最小的结果文件.
注意:对于有损JPG嵌入图像,您必须使用-j:
$ pdfimages -j fileName.pdf fileName # save in .jpg format
Run Code Online (Sandbox Code Playgroud)
有了最近的poppler,你可以使用-all将有损保存为jpg而无损为png
在很少提供的Win平台上,你必须从http://blog.alivate.com.au/poppler-windows/下载最新的(0.37 2015)'poppler-util'二进制文件.
Cod*_*der 13
当批量处理大型PDF到PNG和JPG以使用使用的底层gs(也称为Ghostscript)命令时,我发现它更快更稳定convert.
您可以在输出中看到该命令,convert -verbose并且还有一些可能的调整(YMMV)很难/无法直接访问convert.
但是,使用它会更难修剪和锐化gs,所以,就像我说的那样,YMMV!
fmw*_*w42 12
在 ImageMagick 中,您可以进行“超级采样”。您指定一个较大的密度,然后根据最终输出尺寸的需要尽可能缩小尺寸。例如你的形象:
convert -density 600 test.pdf -background white -flatten -resize 25% test.png
Run Code Online (Sandbox Code Playgroud)
下载图像以全分辨率查看以进行比较。
如果您希望进行进一步处理,我不建议将其保存为 JPG。
如果您希望输出与输入的大小相同,则将大小调整为密度与 72 之比的倒数。例如,-密度 288 和 -resize 25%。288=4*72 和 25%=1/4
密度越大,得到的质量越好,但处理时间会更长。
它还为您带来了良好的效果:
exec("convert -geometry 1600x1600 -density 200x200 -quality 100 test.pdf test_image.jpg");
Run Code Online (Sandbox Code Playgroud)
Linux用户在这里:我尝试了convert命令行实用程序(用于PDF到PNG),但我对结果不满意。我发现这更容易,并且效果更好:
pdftk file.pdf cat 3 output page3.pdfGIMP
Resolution从更改100为300或600 pixel/inGIMP导出为PNG(将文件扩展名更改为.png)中编辑:
按照中的要求添加了图片Comments。使用的转换命令:
convert -density 300 -trim struct2vec.pdf -quality 100 struct2vec.png
GIMP:以300 dpi(px / in)的速度导入;导出为PNG压缩级别3。
我没有在命令行上使用GIMP(请参阅下面的我的评论)。