PDF文档是否包含具有不同DPI的图像?

Dan*_*iel 4 pdf poppler dpi

这个问题说明了一切.是否包含具有不同dpi(Dot Per Inch)图像的PDF文档?

或者假设如果我知道一张图像的dpi,我就知道整个文件了吗?

Kur*_*fle 9

我赞成了@ypnos的答案,这是完全正确的.

但我想通过展示该pdfimages实用程序的最新新功能来补充它.

pdfimages之前已知能够从PDF文件中提取图像(这是它唯一有用的目的).但是,现在您还可以使用它来调查有关所用图像的更多详细信息,而无需提取它们.

使用下一个命令,我使用新-list参数查询某个PDF文件的第7页和第8页上的所有图像的数据:

pdfimages -list -f 7 -l 8  ct-magazin-14-2012.pdf

  page   num  type   width height color comp bpc  enc interp  object ID
  ---------------------------------------------------------------------
     7     0 image     581   838  rgb     3   8  jpeg   no        39  0
     7     1 image       4     4  rgb     3   8  image  no        40  0
     7     2 image     314   332  rgb     3   8  jpx    no        44  0
     7     3 image     358   430  rgb     3   8  jpx    no        45  0
     7     4 image       4     4  rgb     3   8  image  no        46  0
     7     5 image       4     4  rgb     3   8  image  no        47  0
     7     6 image       4     6  rgb     3   8  image  no        48  0
     7     7 image     596   462  rgb     3   8  jpx    no        49  0
     7     8 image       4     6  rgb     3   8  image  no        50  0
     7     9 image       4     4  rgb     3   8  image  no        51  0
     7    10 image       8    10  rgb     3   8  image  no        41  0
     7    11 image       6     6  rgb     3   8  image  no        42  0
     7    12 image     113    27  rgb     3   8  jpx    no        43  0
     8    13 image     582   839  gray    1   8  jpeg   no      2080  0
     8    14 image     344   364  gray    1   8  jpx    no      2079  0

请注意,但是:这个版本pdfimages是poppler的(从XPDF的一个人在一个没有(还)支持这一新功能?):

pdfimages -version

  pdfimages version 0.20.2
  Copyright 2005-2012 The Poppler Developers - http://poppler.freedesktop.org
  Copyright 1996-2011 Glyph & Cog, LLC

-list选项首次出现在2012年3月1日发布的Poppler v0.19.0中.

现在,上面的列表并没有直接告诉你图像的分辨率("dpi").该值取决于:在PDF页面上呈现此图像的大小?

PDF可以轻松地在PDF文件的不同位置使用相同的图像,每种场合使用不同的渲染大小.图像只需要嵌入到PDF中一次,但可以多次使用/"通过引用"渲染(效率低下的PDF可能仍然多次包含相同的图像,但这是一个不同的主题......)

现在让我们清楚查看相应列标题可能产生的问题.他们的意思是什么?

page

  • 包含图像的PDF中的页码.

num

  • 当前列表的图像编号.

type

  • 图像类型.可能的值是:( image不透明图像),mask(单色图像掩模),smask(软掩模图像)和stencil(用于绘制颜色或图案的单色掩模图像).注意: 图像的PDF透明度是使用两个单独的PDF对象创建的:一个用于图像,另一个用于蒙版或smask.属于透明图像的掩模/ smask总是直接跟随列表中的图像.

width

  • 图像宽度,以像素为单位.

height

  • 图像高度,以像素为单位.

color

  • 图像颜色空间.可能的值是gray,rgb,cmyk,lab(L*A*B), icc(基于ICC), index(索引颜色), sep(分离)和devn(器件N).

comp

  • 图像使用的颜色分量数.

bpc

  • 图像使用的每个颜色分量位数.

enc

  • 图像使用的编码(压缩).可能的值有:( image光栅图像 - 可以在内部使用通用/Flate/LZW压缩,但不是特殊的图像编码),jpeg(JPEG压缩),jpx(JPEG2000压缩),jbig2(JBIG2压缩)和ccitt(传真压缩).

interp

  • 是否yes在放大图像时请求插值.

object ID

  • 文件内的图像的PDF对象ID(带有"世代号").

更新(2016年3月)

从Poppler v0.25.0(2013年12月11日发布)及更高版本开始,该命令pdfimages -list现在包含新列,用于指示PDF渲染器在PDF页面中显示的每个嵌入图像的自动计算x-ppi(水平)和y-ppi(垂直)分辨率.

另外,指示了每个图像(未压缩时)使用的大小(以字节/ kB字节为单位)以及其大小压缩比(如PDF中所示).

要显示与上述相同文件的结果(使用Poppler v0.42.0):

page num type width height color comp bpc enc interp objectID x-ppi y-ppi size ratio
------------------------------------------------------------------------------------
   7  0 image   581   838  rgb     3   8 jpeg   no       39 0    73    73 2107B 0.1%
   7  1 image     4     4  rgb     3   8 image  no       40 0   150   150   54B 112%
   7  2 image   314   332  rgb     3   8 jpx    no       44 0   150   150 19.0K 6.2%
   7  3 image   358   430  rgb     3   8 jpx    no       45 0   150   150 15.7K 3.5%
   7  4 image     4     4  rgb     3   8 image  no       46 0   150   150   62B 129%
   7  5 image     4     4  rgb     3   8 image  no       47 0   150   150   51B 106%
   7  6 image     4     6  rgb     3   8 image  no       48 0   150   150   62B  86%
   7  7 image   596   462  rgb     3   8 jpx    no       49 0   150   150 40.7K 5.0%
   7  8 image     4     6  rgb     3   8 image  no       50 0   150   150   86B 119%
   7  9 image     4     4  rgb     3   8 image  no       51 0   150   150   62B 129%
   7 10 image     8    10  rgb     3   8 image  no       41 0   150   150  157B  65%
   7 11 image     6     6  rgb     3   8 image  no       42 0   150   150   82B  76%
   7 12 image   113    27  rgb     3   8 jpx    no       43 0   151   152 1090B  12%
   8 13 image   582   839  gray    1   8 jpeg   no     2080 0    72    72  319B 0.1%
   8 14 image   344   364  gray    1   8 jpx    no     2079 0   150   150 4325B 3.5%
Run Code Online (Sandbox Code Playgroud)

x-ppi

  • 在PDF页面上呈现时图像的水平分辨率(以每英寸像素为单位).

y-ppi

  • 在PDF页面上呈现时图像的垂直分辨率(以每英寸像素为单位).

size

  • PDF文件中嵌入图像的大小.后缀正在使用中:'B'字节,'K'千字节,'M'兆字节和'G'千兆字节.

ratio

  • 嵌入图像的压缩比.