Python:从PNG提取元数据

Lor*_*sum 5 python png metadata

我可以使用R提取必要的信息,但是为了在整个项目中保持一致,我希望能够使用Python(最好是Python3)做到这一点。我需要一个名为“设置”的标签的内容。此标记包含XML,然后需要对其进行解析。

在R中获取元数据非常简单:

library(exifr)
library(XML)

path = file.path('path', 'to', 'file')

x = read_exif(file.path(path,'image.png'))
x$Settings
Run Code Online (Sandbox Code Playgroud)

看起来Python无法做到这一点,这让我很困惑。或这样做需要我比目前拥有更多的Python和PNG知识。如何使用Python提取PNG元数据?


这是我尝试过的事情清单:

PyPng PyPNG似乎很有希望。检查每个块的长度,似乎“ Settings”标签位于zTXt块中。

import png

filename = "C:\\path\\to\\image.png"

im = png.Reader(filename)

for c in im.chunks():
    print(c[0], len(c[1]))

>>>
IHDR 13
tIME 7
pHYs 9
IDAT 47775
zTXt 714
IEND 0
Run Code Online (Sandbox Code Playgroud)

以上摘自这篇文章。但是,仍不清楚如何提取zTXt数据。

hachoir3

使用该hachoir3软件包,我尝试了以下操作:

from hachoir.parser import createParser
from hachoir.metadata import extractMetadata

filename = "C:\\path\\to\\file\\image.png"
parser = createParser(filename)
metadata = extractMetadata(parser)

for line in metadata.exportPlaintext():
    print(line)
Run Code Online (Sandbox Code Playgroud)

这给了我以下内容:

Metadata:
- Image width: 1024 pixels
- Image height: 46 pixels
- Bits/pixel: 16
- Pixel format: RGB
- Compression rate: 2.0x
- Image DPI width: 1 DPI
- Image DPI height: 1 DPI
- Creation date: 2016-07-13 19:09:28
- Compression: deflate
- MIME type: image/png
- Endianness: Big endian
Run Code Online (Sandbox Code Playgroud)

我似乎无法到达我所需要的领域,即R代码中引用的“设置”。我没有其他方法的运气,例如metadata.get。据我所知,这似乎是解析PNG元数据的两个选项。该文档阅读,

一些好的(但不是完美的;-)解析器:

Matroska视频Microsoft RIFF(AVI视频,WAV音频,CDA文件)PNG图片TAR和ZIP存档

也许只是没有我需要的功能?

枕头

按照这篇文章中给出的建议:

from PIL import Image
filename = "C:\\path\\to\\file\\image.png"
im = Image.open(filename)
Run Code Online (Sandbox Code Playgroud)

这会读入图像,但im.info只会返回{'aspect': (1, 1)}。通读文档,看起来没有任何方法可以获取元数据。我通读了帖子中提供的PNG描述。老实说,我不知道如何利用其信息,也不知道Pillow如何为我提供帮助。

有一些帖子暗示我可以完成所需的操作,但它们不起作用。例如,这篇文章建议使用ExifTags库:

from PIL import Image, ExifTags
filename = "C:\\path\\to\\file\\image.png"
im = Image.open(filename)
exif = { ExifTags.TAGS[k]: v for k, v in im._getexif().items() if k in ExifTags.TAGS}
Run Code Online (Sandbox Code Playgroud)

问题是AttributeError: 'PngImageFile' object has no attribute '_getexif'。根据文档,此._getexif功能是实验性的,仅适用于JPG。

通读整个Pillow文档,实际上只谈论JPG和TIFF。处理PNG文件似乎根本不是软件包的一部分。因此hachoir,也许无法完成?

皮尔

显然还有另一个PIL软件包是Pillow派生出来的。看起来它在2009年被遗弃了。

ada*_*p87 17

您可以通过访问加载图像的信息字典来使用 Pillow 获取 EXIF 元数据。

从 Pillow 6.0 开始,可以从 PNG 图像中读取 EXIF 数据。load()然而,与其他图像格式不同,EXIF 数据在被调用 之前不能保证出现在 info 中。https://pillow.readthedocs.io/en/stable/handbook/image-file-formats.html#png

from PIL import Image

filename = 'path/to/img'
im = Image.open(filename)
im.load()  # Needed only for .png EXIF data (see citation above)
print(im.info['meta_to_read'])
Run Code Online (Sandbox Code Playgroud)

我正在使用 conda 存储库中的 Python 3.7 和pillow 7.1.2。


Spo*_*ess 3

这是一个不优雅、笨拙但有效的解决方案。

改编自这里:https://motherboard.vice.com/en_us/article/aekn58/hack-this-extra-image-metadata-using-python

您可以从 python 中调用命令行 exiftools 应用程序,然后解析结果。

以下是在 Ubuntu 16.04 下的 Python 3.6.3 中运行的代码:

import subprocess

result = subprocess.run(['exiftool', '-h', '/home/jason/Pictures/kitty_mask.png'], stdout=subprocess.PIPE)
print (type(result))
print ("\n\n",result.stdout)
normal_string = result.stdout.decode("utf-8")
print("\n\n", normal_string)
Run Code Online (Sandbox Code Playgroud)

它为我的测试图像生成以下结果:

> <class 'subprocess.CompletedProcess'>
> 
> 
>  b'<!-- /home/jason/Pictures/kitty_mask.png
> -->\n<table>\n<tr><td>ExifTool Version Number</td><td>10.80</td></tr>\n<tr><td>File
> Name</td><td>kitty_mask.png</td></tr>\n<tr><td>Directory</td><td>/home/jason/Pictures</td></tr>\n<tr><td>File
> Size</td><td>25 kB</td></tr>\n<tr><td>File Modification
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr>\n<tr><td>File
> Access Date/Time</td><td>2018:07:09
> 16:23:24+01:00</td></tr>\n<tr><td>File Inode Change
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr>\n<tr><td>File
> Permissions</td><td>rw-r--r--</td></tr>\n<tr><td>File
> Type</td><td>PNG</td></tr>\n<tr><td>File Type
> Extension</td><td>png</td></tr>\n<tr><td>MIME
> Type</td><td>image/png</td></tr>\n<tr><td>Image
> Width</td><td>2448</td></tr>\n<tr><td>Image
> Height</td><td>3264</td></tr>\n<tr><td>Bit
> Depth</td><td>8</td></tr>\n<tr><td>Color
> Type</td><td>RGB</td></tr>\n<tr><td>Compression</td><td>Deflate/Inflate</td></tr>\n<tr><td>Filter</td><td>Adaptive</td></tr>\n<tr><td>Interlace</td><td>Noninterlaced</td></tr>\n<tr><td>Image
> Size</td><td>2448x3264</td></tr>\n<tr><td>Megapixels</td><td>8.0</td></tr>\n</table>\n'
> 
> 
>  <!-- /home/jason/Pictures/kitty_mask.png --> <table> <tr><td>ExifTool
> Version Number</td><td>10.80</td></tr> <tr><td>File
> Name</td><td>kitty_mask.png</td></tr>
> <tr><td>Directory</td><td>/home/jason/Pictures</td></tr> <tr><td>File
> Size</td><td>25 kB</td></tr> <tr><td>File Modification
> Date/Time</td><td>2018:07:02 09:35:00+01:00</td></tr> <tr><td>File
> Access Date/Time</td><td>2018:07:09 16:23:24+01:00</td></tr>
> <tr><td>File Inode Change Date/Time</td><td>2018:07:02
> 09:35:00+01:00</td></tr> <tr><td>File
> Permissions</td><td>rw-r--r--</td></tr> <tr><td>File
> Type</td><td>PNG</td></tr> <tr><td>File Type
> Extension</td><td>png</td></tr> <tr><td>MIME
> Type</td><td>image/png</td></tr> <tr><td>Image
> Width</td><td>2448</td></tr> <tr><td>Image
> Height</td><td>3264</td></tr> <tr><td>Bit Depth</td><td>8</td></tr>
> <tr><td>Color Type</td><td>RGB</td></tr>
> <tr><td>Compression</td><td>Deflate/Inflate</td></tr>
> <tr><td>Filter</td><td>Adaptive</td></tr>
> <tr><td>Interlace</td><td>Noninterlaced</td></tr> <tr><td>Image
> Size</td><td>2448x3264</td></tr>
> <tr><td>Megapixels</td><td>8.0</td></tr> </table>
Run Code Online (Sandbox Code Playgroud)

  • 如果您要调用 exiftool,那么我建议删除“-h”选项。这将为您提供原始输出,因此您不需要解析 html,只需解析您需要的标签。 (6认同)