如何将AxesImage中的坐标映射到已保存图像文件中的坐标?

Veb*_*osa 6 python matplotlib

我使用matplotlib将数字矩阵显示为图像,沿轴附加标签,并将绘图保存到PNG文件.为了创建HTML图像映射,我需要知道PNG文件中由imshow显示的图像中的区域的像素坐标.

我已经找到了一个如何使用常规绘图执行此操作的示例,但是当我尝试使用imshow执行相同操作时,映射不正确.这是我的代码,它保存图像并尝试打印对角线上每个正方形中心的像素坐标:

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
axim = ax.imshow(np.random.random((27,27)), interpolation='nearest')
for x, y in  axim.get_transform().transform(zip(range(28), range(28))):
    print int(x), int(fig.get_figheight() * fig.get_dpi() - y)
plt.savefig('foo.png', dpi=fig.get_dpi())
Run Code Online (Sandbox Code Playgroud)

这是生成的foo.png,显示为截图以包含标尺:

带有标尺的foo.png的屏幕截图

脚本的输出开始和结束如下:

73 55
92 69
111 83
130 97
149 112
…
509 382
528 396
547 410
566 424
585 439
Run Code Online (Sandbox Code Playgroud)

如你所见,y坐标是正确的,但x坐标是拉伸的:它们的范围从73到585而不是预期的135到506,它们间隔19像素而不是预期的14.我在做什么错误?

Joe*_*ton 12

这是尝试从matplotlib获取精确像素值的更令人困惑的部分之一.Matplotlib将绘制精确像素值的渲染器与绘制图形和轴的画布分开.

基本上,最初创建(但尚未显示)图形时存在的渲染器不一定与显示图形或将其保存到文件时使用的渲染器相同.

你正在做的是正确的,但是它使用的是初始渲染器,而不是保存图形时使用的渲染器.

为了说明这一点,这里是您的代码的略微简化版本:

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_subplot(111)
im = ax.imshow(np.random.random((27,27)), interpolation='nearest')

for i in range(28):
    x, y =  ax.transData.transform_point([i,i])
    print '%i, %i' % (x, fig.bbox.height - y)

fig.savefig('foo.png', dpi=fig.dpi)
Run Code Online (Sandbox Code Playgroud)

这会产生与上面相似的结果:(差异是由于您的机器和我的机器之间的渲染后端不同)

89, 55
107, 69
125, 83
...
548, 410
566, 424
585, 439
Run Code Online (Sandbox Code Playgroud)

但是,如果我们做同样的事情,而是在显示坐标之前绘制图形,我们得到正确的答案!

import numpy as np
import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_subplot(111)
im = ax.imshow(np.random.random((27,27)), interpolation='nearest')

fig.canvas.draw()

for i in range(28):
    x, y =  ax.transData.transform_point([i,i])
    print '%i, %i' % (x, fig.bbox.height - y)

fig.savefig('foo.png', dpi=fig.dpi)
Run Code Online (Sandbox Code Playgroud)

这产生了:(请记住,图的边缘位于<-0.5, -0.5>在数据坐标,而不是<0, 0>(即,用于绘制图像的坐标是像素为中心的)这是为什么.<0, 0>产率143, 55,并且不135, 48)

143, 55
157, 69
171, 83
...
498, 410
512, 424
527, 439
Run Code Online (Sandbox Code Playgroud)

当然,绘制图形只是为了在保存时再次绘制它是多余的并且计算成本很高.

为避免两次绘制,可以将回调函数连接到绘图事件,并在此函数中输出HTML图像映射.作为一个简单的例子:

import numpy as np
import matplotlib.pyplot as plt

def print_pixel_coords(event):
    fig = event.canvas.figure
    ax = fig.axes[0] # I'm assuming there's only one subplot here...
    for i in range(28):
        x, y = ax.transData.transform_point([i,i])
        print '%i, %i' % (x, fig.bbox.height - y)

fig = plt.figure()
ax = fig.add_subplot(111)
im = ax.imshow(np.random.random((27,27)), interpolation='nearest')

fig.canvas.mpl_connect('draw_event', print_pixel_coords)

fig.savefig('foo.png', dpi=fig.dpi)
Run Code Online (Sandbox Code Playgroud)

这样可以产生正确的输出,同时只保存一次,保存时:

143, 55
157, 69
171, 83
...
498, 410
512, 424
527, 439
Run Code Online (Sandbox Code Playgroud)

另一个优点是您可以在调用中使用任何dpi,fig.savefig而无需fig事先手动设置对象的dpi.因此,在使用回调函数时,您可以执行fig.savefig('foo.png'),(或fig.savefig('foo.png', dpi=whatever)),您将获得与保存的.png文件匹配的输出.(保存图形时的默认dpi为100,而图形对象的默认dpi为80,这就是为什么必须指定dpi与第一个相同的原因fig.dpi)

希望这至少有点清楚!